Заголовок сообщения: Большие тексты и HTML. Добавлено: 24 Апрель 2003, 19:33:59
Столкнулась с необходимостью поместить в сеть длиннющие тексты.
После ворда html получился такой, что проще сразу застрелиться. Хотелось бы спросить людей с опытом : какой путь лучше чтоб почитить НТМЛ?
2) dreamweaver команда - "Clean up Word HTML" –
достаточно ли этого? Или придется дочищать вручную? (Пока что при попыпке прогнать тексты через DW комп завис...)
3) Слышала о какой-то неофициальной программе от Майкрософт, распространяемой бесплатно, которая чудесным образом чистит все эти проблемы. Вы с ней сталкивались?Не подскажете, о чем речь?
Речь идет о голом тексте, без ссылок, графики и таблиц. Текст в Ворд XP.
Я сама иллюстратор и дизайнер, опыт работы с НТМл, увы. скромен, сижу вот, изобретаю велосипед. Буду очень благодарна за совет.
Спасибо.
12 Сообщения: 3239 Зарегистрирован: 03.05.02 Откуда: Европа
Добавлено: 24 Апрель 2003, 23:02:47
Лето, вопрос загадочный... Даже и не знаешь как ответить... А зачем этот текст вообще был сохранён в Ворде как HTML???
В принципе Дрим конечно вычистит. Но часто вместе с форматированием.
Но в общем и целом - не нужно форматировать его в Ворде НИКОГДА и всё будет прекрасно. Сохраняете как текст, потом этот текст пихаете например в тот же Дрим. А на смом деле всё равно придётся руками доделывать.
"Типограф" тут вообще не из этой оперы и не для этого. И работает криво.
А что до тайной микрософтовской программы - если найдёте, скажите мне, я подивлюсь. После того, как они создали Фронтпейдж я полагал, что к HTML их софтину подпускать нельзя на выстрел!
Goldie, стало быть реальных проектов ты не делал.… Ну ничего страшного, со временем ты обязательно окажешьс в ситуации, которую описывает Лето.
Что я могу предложить: сохранить все тексты в HTML используя Office 97 (он создает совсем другой HTML, не тот, что 2000 или XP), который уже и передевать DW на чистку.
Если файлов достаточно много, то пишется свой скрипт (на перле, к примеру), который будет чистить эти файлы. Обычно это имеет смысл при полутысяче и более документов.
Наврняка потеряются: формулы и рисунки, фреймы. Будут проблемы с таблицами.
Как всегда, стОит рассмотреть вопрос: а не проще ли вместо перевода в HTML вывесить аннотированные ссылки на фордовые файлы?
_________________ We've got the big memory and the small memory. The small memory's to remember the small things and the big memory's to forget the big ones.
Лето, минимальные затраты -путь, указанный Акелой.
В Дрим загнать только текст и там уже отформатировать.
Личные замеры - вордовский файл (Из 2000 го )- (120 кб) очищен Дримом- (65 кб)
отформатирован с нуля - (22 кб)
17 Сообщения: 4362 Зарегистрирован: 25.04.01 Откуда: Москва
Добавлено: 25 Апрель 2003, 10:22:00
кстати, интересная штучка. пустой документ чистит почти в 5 раз (если после него убрать мета теги генератора)! Ну а если большой документ, то сжатие около 2 раз, что, согласитесь для мелкософта, тоже очень не плохо Хотя 2 раза - наверное не очень хороший результат - секретарь разметку по отделению абзацев (да и вообще блоков) делала с помощью ентера и фильтр ченсно перевел их в блоки вида
<p class=MsoNormal>&</p> . если их убрать - будет порядка 2.5 разница. не плохо для автоматического фильтра
_________________ Мудрость не всегда приходит с возрастом. Бывает, что возраст приходит один.
12 Сообщения: 3239 Зарегистрирован: 03.05.02 Откуда: Европа
Добавлено: 25 Апрель 2003, 10:36:21
hokum, Long, сенкс... Ну для Вордовых файлов вероятно да... Спорить не буду - мне проще, удобнее и быстрее так, как я сказал. Ворд, имхо, существует исключительно для напоминаний об орфографии.
5 Сообщения: 481 Зарегистрирован: 05.07.01 Откуда: Москва
Добавлено: 25 Апрель 2003, 11:18:08
Akela писал(а):
Лето ...Но в общем и целом - не нужно форматировать его в Ворде НИКОГДА и всё будет прекрасно. Сохраняете как текст, потом этот текст пихаете например в тот же Дрим. А на смом деле всё равно придётся руками доделывать...
Часто материалы присылают именно в виде вордовского файла. Наверно у Лето именно такой случай.
Насчет фильтра - если (в самом ворде) удалить стили, оформление и прочую шелуху, документ можно сжать в три, а то и четыре раза. В любом случае фильтр полезная вещь, рекомендую.
Microsoft Office HTML Filter действительно та программа, про которую я слышала. Правда она не работает с Office МХ, но это уже мелочи. Сейчас попробую все методы.
Вы очень помогли!
12 Сообщения: 3239 Зарегистрирован: 03.05.02 Откуда: Европа
Добавлено: 25 Апрель 2003, 11:28:37
arlekino, я же не говорил НЕ ПОЛЬЗОВАТЬСЯ Вордом! Я сказал НЕ ФОРМАТИРОВАТЬ в нём! Имхо saveAs --> text plain никто не отменял? А для форматирования HTML придумано множество прекрасных программ. Но это уже другая история...
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.