Заголовок сообщения: Вопрос про кодировку Добавлено: 21 Декабрь 2006, 18:40:07
Уважаемые,
делаю сайт, домен русский, информацию хотят разместить и русскую и английскую на одной странице (т.е. половина страницы на одном языке, половина - на другом). Сайт юзать будут посетители из России и Европы.
Суть вопроса - какую кодировку выбрать? W-1251 подойдет или Юникод? Или другую? Или вообще это значения не имеет (имеет конечно, но можно забить)? Просто никогда не сталкивался, может вопрос тупой... Чтобы для европейцев русские буквы не отражались как калаберда...
, для редактирования недостаточно блокнота, фара и даже хомсайта. Вобщем сплошные неудобства.
Лет 15 назад один добрый человек дал мне правильный совет: "если у вас есть проблемы с кривым софтом -- не используйте этот кривой софт". Найти нормальный редактор для UTF-8 -- давно не проблема. Последний раз меня это всерьез озадачило году эдак в 99.
Последний раз редактировалось Crazy 22 Декабрь 2006, 16:52:18, всего редактировалось 1 раз.
из собственного опыта и статистики по хостеру - бд в юникоде, юзеру возврат в 1251
Какой смысл заранее создавать себе геморрой на случай, если вдруг придется создавать многоязычный контент. Я могу понять, когда база настроена на однобайтовую кодировку и изменить это нет возможности. Но если данные УЖЕ хранятся нормально, то зачем портить их при отдаче?
утф всему голова. ну русские символы в два раза длинее получаются, в отличии от английских, но зато ништяк - нет проблем со всякими сервисами, общая глобализация и все такое.
Каждый символ кодируется 5-7 байтами, для редактирования недостаточно блокнота, фара и даже хомсайта. Вобщем сплошные неудобства.
Хех...
Цитата:
Весь тот материал, который говорит о том, что "простой текст = ascii = символы из 8 бит", не только неправилен, он безнадежно неправилен, и если Вы все еще программируете по этим принципам, вы не намного лучше, чем доктор, который не верит в микробы. Пожалуйста, не пишите ни одной строки кода, пока вы не закончите читать эту статью.
tentoys, рад, что Вы открыли для себя факт существования множества кодовых таблиц. Хорошо, что есть такие популяризаторы знаний, которые могут донести их до каждого.
Здесь только 1 (одна) строка в UTF-8. Просто у тебя очень серьезные проблемы с пониманием термина "UTF".
Чобы было понятно -- на примере ASCII:
1. 'a' -- символ в кодирвке ASCII (к примеру)
2. =61 -- тот же символ, переведенный в Quoted Printable.
И это вовсе не означает, что ASCII символ требует от 1 до 3 байт. Он требует всегда 1 байт. Но если мы переведем его в другую кодировку -- в ней он будет занимать некоторое другое количество байт (большее или меньшее) сообразно кодировке.
#1055 и \u041F -- это вовсе не UTF. Это две другие кодировки, предназначенные для передачи UTF-символов по каналу, который поддерживает только ASCII. Почувствуй разницу.
tentoys, рад, что Вы открыли для себя факт существования множества кодовых таблиц. Хорошо, что есть такие популяризаторы знаний, которые могут донести их до каждого.
Популяризаторы знаний нужны именно для того, чтобы донести понимание для тех, кто до сих пор ограничивался только запоминанием названия.
abraitcev, я рад, что Вы рады. Только вопрос не обо мне и не о моих открытиях.
Цитата:
Каждая длиннее оригинала, выбирай любую
Хотя да, попробую ещё раз побывать популяризатором. Удастся осилить RFC 3629?
Ну или просто-напросто набрать в википедии искомое слово и почитать Право слово, нет желания спорить и доказывать, мы ж просто общаемся, n'est pas?
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.