Парсинг MS WORD из PHP @ DeForum.ru
DeДверь  
Логин:  
Пароль:  
  Автологин  
   
Разместить рекламу
Письмо админу
Правила | FAQ | *Поиск | Наша команда | Регистрация | Вход
 
 
 Страница 1 из 1 [ Сообщений: 5 ] 
*   Список форумов / Начинка и техника / Программирование для WWW » ответить » создать топик « | »
Автор Сообщение
Konyukhov Муж.
новый человек
0
Сообщения: 166
Зарегистрирован: 10.12.06
Откуда: 89
Заголовок сообщения: Парсинг MS WORD из PHP
Сообщение Добавлено: 19 Январь 2009, 15:10:34 
Если кто сталкивался, поделитесь опытом.

_________________
Лишь одно в моём кармане - беспонтовый пирожок
djArf
новый человек
0
Сообщения: 2
Зарегистрирован: 20.03.09
Заголовок сообщения: Re: Парсинг MS WORD из PHP
Сообщение Добавлено: 20 Март 2009, 16:11:14 
Если задача состоит в том, чтобы парсить содержимое (без учета стилей и прочих способов офрмления), то в сети легко находится php-скриптик от программера, дай Бог памяти, из Обнинска, который конвертирует doc в txt (или html). Ссылки на этот скриптик лежат даже на зарубежных поисковиках. Дальше, думаю, понятно. Единственное НО: скрипт неважно работает с большими doc'ами. Я конвертил кусками заданного размера (килобайт так по 5).
otvetchikoff Муж.
соучастник
0
Сообщения: 350
Зарегистрирован: 12.02.09
Откуда: Moscow
Сообщение Добавлено: 20 Март 2009, 16:20:22 

Konyukhov писал(а):
Если кто сталкивался, поделитесь опытом.


а смысл? не легче в том же Word нужную информацию сохранять в html и парсить уже понятный html, а не doc?

_________________
do!
djArf
новый человек
0
Сообщения: 2
Зарегистрирован: 20.03.09
Сообщение Добавлено: 22 Март 2009, 17:30:18 
Иногда нужно использовать готовые doc'и... У меня был заказик - генерировать многостраничный сайт из готовых doc'ов по пригципу "один doc - один сайт". Вот тут скрипт из Обнинска и пригодился...
Crazy Муж.
Модератор
107
Сообщения: 14561
Зарегистрирован: 23.12.01
Откуда: Moscow
Сообщение Добавлено: 22 Март 2009, 18:04:00 
djArf, для решения этой задачи не нужны никакие парсеры на php. Это тривиально делается средствами OLE Automation. Что я, собственно, именно в такой ситуации и проделал несколько раз 6-7 лет назад. При этом никаких ограничений на размер нет.

Собственно, этот вариант и предлагает otvetchikoff. Причем чем здесь пассаж про "иногда нужно использовать готовые doc'и" осталось для меня загадкой.
*   Список форумов / Начинка и техника / Программирование для WWW « | » » ответить » создать топик
 Страница 1 из 1 [ Сообщений: 5 ] 
Показать сообщения за:   Поле сортировки  
Найти:
Перейти:  
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.
cron


ООО ДеФорум
При использовании материалов сайта ссылка на DeForum.ru — обязательна.
Проект Павла Батурина ©2001-2077; // Powered by phpBB © 2013 phpBB Group
Rambler's Top100