Опечатки @ DeForum.ru
DeДверь  
Логин:  
Пароль:  
  Автологин  
   
Разместить рекламу
Письмо админу
Правила | FAQ | *Поиск | Наша команда | Регистрация | Вход
 
 
 Страница 1 из 1 [ Сообщений: 5 ] 
*   Список форумов / Начинка и техника / Программирование для WWW » ответить » создать топик « | »
Автор Сообщение
Acid~Jazz Муж.
соучастник
1
Сообщения: 740
Зарегистрирован: 12.04.03
Откуда: Зеленоград
Заголовок сообщения: Опечатки
Сообщение Добавлено: 11 Июнь 2003, 22:27:14 
Есть онлайновый словарь. Структура данных, соответственно: ["cлово" => "значение этого слова, подробно изложенное"]. Вводим в поле слово - скрипт делает запрос по нему и выдает значение.

Хочется добавить в словарь возможность понимать опечатки пользователя и подсказывать возможные верные варианты. Думал-думал как бы это устроить, да и не пришло до сих пор решение.

Видел в деле модули для перла, которые на введеное слово возвращают его "транскрипцию" и таким образом позволяют сравнить по звучанию два слова. Нет ли чего-нибудь подобного, что помогло бы в моем случае?

_________________
начинающий менеджер . http://acidjazz.photosight.ru/
Wartex Муж.
Злой Дух
9
Сообщения: 1774
Зарегистрирован: 06.10.01
Откуда: Halifax, Canada
Сообщение Добавлено: 12 Июнь 2003, 05:59:50 
soundex

_________________
Digital Reality Crew
Acid~Jazz Муж.
соучастник
1
Сообщения: 740
Зарегистрирован: 12.04.03
Откуда: Зеленоград
Сообщение Добавлено: 12 Июнь 2003, 14:39:16 
soundex не поможет, если ошибка в первой букве.
soundex предлагает уж очень непохожие слова.
soundex не катит с русскими словами.

так что не подходит.

_________________
начинающий менеджер . http://acidjazz.photosight.ru/
Wartex Муж.
Злой Дух
9
Сообщения: 1774
Зарегистрирован: 06.10.01
Откуда: Halifax, Canada
Сообщение Добавлено: 13 Июнь 2003, 04:38:49 
levenshtein(), metaphone(), similar_text().

_________________
Digital Reality Crew
Acid~Jazz Муж.
соучастник
1
Сообщения: 740
Зарегистрирован: 12.04.03
Откуда: Зеленоград
Сообщение Добавлено: 13 Июнь 2003, 13:16:47 
С metaphone() я уже сделал вариант.

Добавил еще одно поле в таблицу, заполнил его значениями metaphone(word) и, если надо, выбираю по нему. Однако, работает это все далеко не так хорошо как хотелось бы. А именно - некоторые простые опечатки так искажают произношение, что не отлавливаются методом использующим metaphone(). Например, на запрос "manson" мой словарик не предложил ни одного варианта, ни "mason", ни "mansion", в то время как yandex.lingvo предлагает более 30 вариантов, из которых по крайней мере половина у меня в базе имеется.

Видимо, надо придумать способ быстро сравнивать запрос со всеми сотнями тысяч слов при помощи левенштейнов, симилар текста и др. :)

_________________
начинающий менеджер . http://acidjazz.photosight.ru/
*   Список форумов / Начинка и техника / Программирование для WWW « | » » ответить » создать топик
 Страница 1 из 1 [ Сообщений: 5 ] 
Показать сообщения за:   Поле сортировки  
Найти:
Перейти:  
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.
cron


ООО ДеФорум
При использовании материалов сайта ссылка на DeForum.ru — обязательна.
Проект Павла Батурина ©2001-2077; // Powered by phpBB © 2013 phpBB Group
Rambler's Top100