PHP: аналог trim() для multibyte (mb) strings @ DeForum.ru

В документации в разделе про Multibyte String Functions сказано:

Цитата:

When you manipulate (trim, split, splice, etc.) strings encoded in a multibyte encoding, you need to use special functions since two or more consecutive bytes may represent a single character in such encoding schemes.

Однако, я перерыл весь список функций расширения mbstring и не нашел ни одной функции, которая была бы альтернативой функции trim() для строк в однобайтовых кодировках. Более того, у меня даже не получилось составить цепочку вложенных mb_*-функций для получения нужного результата. Подскажите пожалуйста самый оптимальный способ? Желательно без всяких циклов.

А чем mb_ereg_replace не устраивает?

Мне кажется, что подключение регулярных выражений для такой простой операции -- это как из пушки по воробьям.

Я предпочитаю perl-compatible функции, вот у меня какой вариант получился:

Код:

echo preg_replace('/\\A\s*(.*[^\s])?\s*\\z/u', '$1', $str);

Есть способ проще (быстрее)?

12 Сообщения: 971 Зарегистрирован: 27.09.05

preg_replace('@^\s*|\s*$@u', '', $str);

не ручаюсь за тонкости, я ща больше по яваскрипту

Большое спасибо, действительно, это выглядит проще. Взгяд на проблему с другой стороны

Paul Yanchenko, жди РНР6, в котором будет полная нативная поддержка

17 Сообщения: 43 Зарегистрирован: 09.09.06

Пардон, что в мешиваюсь.
trim() удаляет в начале и конце строки символы пробельной группы. Все эти символы принадлежат младшей части ASCII. Т.е. в utf-8 они кодируются так же, как и в однобайтовых кодировках.
trim() здесь будет работать точно так же.

gro, а мы уже перешли к использованию UTF-8?

А если это UTF-16? Перечитай внимательно цитату из первого сообщения.

17 Сообщения: 43 Зарегистрирован: 09.09.06

Если utf16, то не прокатит. Так же, как и не прокатит пример 1NV1Z0R, т.к. модификатор "u" тоже подразумевает utf8.
Но для utf8 (имхо, гораздо более распространенного) все будет нормально.

DeДверь
Логин:
Пароль:
	Автологин