Вопрос про кодировку @ DeForum.ru

Уважаемые,
делаю сайт, домен русский, информацию хотят разместить и русскую и английскую на одной странице (т.е. половина страницы на одном языке, половина - на другом). Сайт юзать будут посетители из России и Европы.

Суть вопроса - какую кодировку выбрать? W-1251 подойдет или Юникод? Или другую? Или вообще это значения не имеет (имеет конечно, но можно забить)? Просто никогда не сталкивался, может вопрос тупой... Чтобы для европейцев русские буквы не отражались как калаберда... :confused:

91 Сообщения: 1163 Зарегистрирован: 26.01.05

не принципиально, unicode удобнее

win-1251 пойдет

84 Сообщения: 1562 Зарегистрирован: 13.01.05

юникод

UTF. И указать её желательно в .htaccess

Всем спасибо! :beer:

Насколько я понял из ответов, пойдет любая!))) Будем проверять!

UTF-8, чтобы в будущем не иметь проблем.

И проследить, чтобы UTF-8 было указано в HTTP-заголовках, а не в meta.

koshara писал(а):

Всем спасибо! :beer:

Насколько я понял из ответов, пойдет любая!))) Будем проверять!

Странный Вы человек. Где про любую-то сказано? :confused:

из собственного опыта и статистики по хостеру - бд в юникоде, юзеру возврат в 1251

tentoys писал(а):

koshara писал(а):

Всем спасибо! :beer:

Насколько я понял из ответов, пойдет любая!))) Будем проверять!

Странный Вы человек. Где про любую-то сказано? :confused:

Имелась ввиду любая из предложенных! :dandy:

добавил UTF-8 когда появилась норвежская часть сайта. Для русской и английской использовать utf нет никакого смысла.

Каждый символ кодируется 5-7 байтами, для редактирования недостаточно блокнота, фара и даже хомсайта. Вобщем сплошные неудобства.

abraitcev писал(а):

Каждый символ кодируется 5-7 байтами

Господи... Кто тебе сказал эту чушь?

Цитата:

, для редактирования недостаточно блокнота, фара и даже хомсайта. Вобщем сплошные неудобства.

Лет 15 назад один добрый человек дал мне правильный совет: "если у вас есть проблемы с кривым софтом -- не используйте этот кривой софт". Найти нормальный редактор для UTF-8 -- давно не проблема. Последний раз меня это всерьез озадачило году эдак в 99.

sudya писал(а):

из собственного опыта и статистики по хостеру - бд в юникоде, юзеру возврат в 1251

Какой смысл заранее создавать себе геморрой на случай, если вдруг придется создавать многоязычный контент. Я могу понять, когда база настроена на однобайтовую кодировку и изменить это нет возможности. Но если данные УЖЕ хранятся нормально, то зачем портить их при отдаче?

12 Сообщения: 971 Зарегистрирован: 27.09.05

утф всему голова. ну русские символы в два раза длинее получаются, в отличии от английских, но зато ништяк - нет проблем со всякими сервисами, общая глобализация и все такое.

abraitcev писал(а):

Каждый символ кодируется 5-7 байтами, для редактирования недостаточно блокнота, фара и даже хомсайта. Вобщем сплошные неудобства.

Хех...

Цитата:

Весь тот материал, который говорит о том, что "простой текст = ascii = символы из 8 бит", не только неправилен, он безнадежно неправилен, и если Вы все еще программируете по этим принципам, вы не намного лучше, чем доктор, который не верит в микробы. Пожалуйста, не пишите ни одной строки кода, пока вы не закончите читать эту статью.

Вот только неделю назад говорили. Больше слов нету, одни цитаты :-)

читать. читать, написано доступно

Crazy, я не жду пока мне кто-то что-то скажет.
Вот Вам четыре варианта строки в utf-8
Каждая длиннее оригинала, выбирай любую

Код:

Привет мир!
Р_С_РёР_РчС' Р_РёС_!
#1055#1088#1080#1074#1077#1090 #1084#1080#1088!
\u041F\u0440\u0438\u0432\u0435\u0442 \u043C\u0438\u0440!
& #1055;& #1088;& #1080;& #1074;& #1077;& #1090;& #1084;& #1080;& #1088;!

tentoys, рад, что Вы открыли для себя факт существования множества кодовых таблиц. Хорошо, что есть такие популяризаторы знаний, которые могут донести их до каждого.

abraitcev писал(а):

Вот Вам четыре варианта строки в utf-8

Здесь только 1 (одна) строка в UTF-8. Просто у тебя очень серьезные проблемы с пониманием термина "UTF".

Чобы было понятно -- на примере ASCII:

1. 'a' -- символ в кодирвке ASCII (к примеру)
2. =61 -- тот же символ, переведенный в Quoted Printable.

И это вовсе не означает, что ASCII символ требует от 1 до 3 байт. Он требует всегда 1 байт. Но если мы переведем его в другую кодировку -- в ней он будет занимать некоторое другое количество байт (большее или меньшее) сообразно кодировке.

#1055 и \u041F -- это вовсе не UTF. Это две другие кодировки, предназначенные для передачи UTF-символов по каналу, который поддерживает только ASCII. Почувствуй разницу.

abraitcev писал(а):

tentoys, рад, что Вы открыли для себя факт существования множества кодовых таблиц. Хорошо, что есть такие популяризаторы знаний, которые могут донести их до каждого.

Популяризаторы знаний нужны именно для того, чтобы донести понимание для тех, кто до сих пор ограничивался только запоминанием названия.

Так что статью ты все таки прочитай.

abraitcev, я рад, что Вы рады. Только вопрос не обо мне и не о моих открытиях.

Цитата:

Каждая длиннее оригинала, выбирай любую

Хотя да, попробую ещё раз побывать популяризатором. Удастся осилить RFC 3629?
Ну или просто-напросто набрать в википедии искомое слово и почитать
Право слово, нет желания спорить и доказывать, мы ж просто общаемся, n'est pas? :wink:

DeДверь
Логин:
Пароль:
	Автологин