Заголовок сообщения: Re: Парсинг MS WORD из PHP Добавлено: 20 Март 2009, 16:11:14
Если задача состоит в том, чтобы парсить содержимое (без учета стилей и прочих способов офрмления), то в сети легко находится php-скриптик от программера, дай Бог памяти, из Обнинска, который конвертирует doc в txt (или html). Ссылки на этот скриптик лежат даже на зарубежных поисковиках. Дальше, думаю, понятно. Единственное НО: скрипт неважно работает с большими doc'ами. Я конвертил кусками заданного размера (килобайт так по 5).
Иногда нужно использовать готовые doc'и... У меня был заказик - генерировать многостраничный сайт из готовых doc'ов по пригципу "один doc - один сайт". Вот тут скрипт из Обнинска и пригодился...
djArf, для решения этой задачи не нужны никакие парсеры на php. Это тривиально делается средствами OLE Automation. Что я, собственно, именно в такой ситуации и проделал несколько раз 6-7 лет назад. При этом никаких ограничений на размер нет.
Собственно, этот вариант и предлагает otvetchikoff. Причем чем здесь пассаж про "иногда нужно использовать готовые doc'и" осталось для меня загадкой.
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.