Большие тексты и HTML. @ DeForum.ru
DeДверь  
Логин:  
Пароль:  
  Автологин  
   
Разместить рекламу
Письмо админу
Правила | FAQ | *Поиск | Наша команда | Регистрация | Вход
 
 
 Страница 1 из 1 [ Сообщений: 16 ] 
*   Список форумов / Начинка и техника / Программирование для WWW » ответить » создать топик « | »
Автор Сообщение
Лето
новый человек
0
Сообщения: 7
Зарегистрирован: 19.04.03
Заголовок сообщения: Большие тексты и HTML.
Сообщение Добавлено: 24 Апрель 2003, 19:33:59 
Столкнулась с необходимостью поместить в сеть длиннющие тексты.
После ворда html получился такой, что проще сразу застрелиться. Хотелось бы спросить людей с опытом : какой путь лучше чтоб почитить НТМЛ?



1) Лебедевский типограф
http://www.artlebedev.ru/tools/typograf
Кто нибудь здесь этим пользуется? Можно ли ограничится только типографом?

2) dreamweaver команда - "Clean up Word HTML" –
достаточно ли этого? Или придется дочищать вручную? (Пока что при попыпке прогнать тексты через DW комп завис...)

3) Слышала о какой-то неофициальной программе от Майкрософт, распространяемой бесплатно, которая чудесным образом чистит все эти проблемы. Вы с ней сталкивались?Не подскажете, о чем речь?

Речь идет о голом тексте, без ссылок, графики и таблиц. Текст в Ворд XP.

Я сама иллюстратор и дизайнер, опыт работы с НТМл, увы. скромен, сижу вот, изобретаю велосипед. Буду очень благодарна за совет.
Спасибо.
Akela
Констататор
12
Сообщения: 3239
Зарегистрирован: 03.05.02
Откуда: Европа
Сообщение Добавлено: 24 Апрель 2003, 23:02:47 
Лето, вопрос загадочный... Даже и не знаешь как ответить... А зачем этот текст вообще был сохранён в Ворде как HTML???

В принципе Дрим конечно вычистит. Но часто вместе с форматированием.

Но в общем и целом - не нужно форматировать его в Ворде НИКОГДА и всё будет прекрасно. Сохраняете как текст, потом этот текст пихаете например в тот же Дрим. А на смом деле всё равно придётся руками доделывать.

"Типограф" тут вообще не из этой оперы и не для этого. И работает криво.

А что до тайной микрософтовской программы - если найдёте, скажите мне, я подивлюсь. После того, как они создали Фронтпейдж я полагал, что к HTML их софтину подпускать нельзя на выстрел!
Goldie
новый человек
0
Сообщения: 205
Зарегистрирован: 09.03.02
Откуда: Москва
Сообщение Добавлено: 25 Апрель 2003, 00:20:24 
Ой, ну Вы уважаемая замудрили... Какой Word, какой Dream, ручками все нужно, ручками... Только тогда у Вас будет все под контролем! :laugh:

_________________
Выживают, только лучшие...
Crazy Муж.
Модератор
107
Сообщения: 14561
Зарегистрирован: 23.12.01
Откуда: Moscow
Сообщение Добавлено: 25 Апрель 2003, 07:28:05 
Goldie, стало быть реальных проектов ты не делал.… Ну ничего страшного, со временем ты обязательно окажешьс в ситуации, которую описывает Лето. :)

Что я могу предложить: сохранить все тексты в HTML используя Office 97 (он создает совсем другой HTML, не тот, что 2000 или XP), который уже и передевать DW на чистку.

Если файлов достаточно много, то пишется свой скрипт (на перле, к примеру), который будет чистить эти файлы. Обычно это имеет смысл при полутысяче и более документов.

Наврняка потеряются: формулы и рисунки, фреймы. Будут проблемы с таблицами.

Как всегда, стОит рассмотреть вопрос: а не проще ли вместо перевода в HTML вывесить аннотированные ссылки на фордовые файлы?

_________________
We've got the big memory and the small memory. The small memory's to remember the small things and the big memory's to forget the big ones.
Akela
Констататор
12
Сообщения: 3239
Зарегистрирован: 03.05.02
Откуда: Европа
Сообщение Добавлено: 25 Апрель 2003, 07:50:58 

Лето писал(а):
Речь идет о голом тексте, без ссылок, графики и таблиц.

oLL
постоянный участник
12
Сообщения: 2790
Зарегистрирован: 08.09.01
Откуда: ...куда...
Сообщение Добавлено: 25 Апрель 2003, 07:54:03 
Лето, минимальные затраты -путь, указанный Акелой.
В Дрим загнать только текст и там уже отформатировать.
Личные замеры - вордовский файл (Из 2000 го )- (120 кб) очищен Дримом- (65 кб)
отформатирован с нуля - (22 кб)
Akela
Констататор
12
Сообщения: 3239
Зарегистрирован: 03.05.02
Откуда: Европа
Сообщение Добавлено: 25 Апрель 2003, 08:53:57 
Из 97Word - 29k, txt - 4,5k, htm - 6k
hokum
соучастник
4
Сообщения: 637
Зарегистрирован: 21.05.02
Откуда: GMT +24:00
Сообщение Добавлено: 25 Апрель 2003, 09:48:05 
есть-есть такая "неофициальная программка".
чистит действительно неплохо

зовется она "Microsoft Office HTML Filter".
у меня есть 2.0.
линк на скачку не помню, но где-то в дебрях микрософта.
Long Муж.
SubAdmin
Теоретик
17
Сообщения: 4362
Зарегистрирован: 25.04.01
Откуда: Москва
Сообщение Добавлено: 25 Апрель 2003, 09:55:36 
hokum, ты про это?

_________________
Мудрость не всегда приходит с возрастом. Бывает, что возраст приходит один.
Long Муж.
SubAdmin
Теоретик
17
Сообщения: 4362
Зарегистрирован: 25.04.01
Откуда: Москва
Сообщение Добавлено: 25 Апрель 2003, 10:22:00 
кстати, интересная штучка. пустой документ чистит почти в 5 раз (если после него убрать мета теги генератора)! Ну а если большой документ, то сжатие около 2 раз, что, согласитесь для мелкософта, тоже очень не плохо ;) Хотя 2 раза - наверное не очень хороший результат - секретарь разметку по отделению абзацев (да и вообще блоков) делала с помощью ентера и фильтр ченсно перевел их в блоки вида
<p class=MsoNormal>&</p> . если их убрать - будет порядка 2.5 разница. не плохо для автоматического фильтра :glasses:

_________________
Мудрость не всегда приходит с возрастом. Бывает, что возраст приходит один.
hokum
соучастник
4
Сообщения: 637
Зарегистрирован: 21.05.02
Откуда: GMT +24:00
Сообщение Добавлено: 25 Апрель 2003, 10:36:07 
вообще-то я про вот это - http://office.microsoft.com/downloads/2 … htmf2.aspx
Akela
Констататор
12
Сообщения: 3239
Зарегистрирован: 03.05.02
Откуда: Европа
Сообщение Добавлено: 25 Апрель 2003, 10:36:21 
hokum, Long, сенкс... Ну для Вордовых файлов вероятно да... Спорить не буду - мне проще, удобнее и быстрее так, как я сказал. Ворд, имхо, существует исключительно для напоминаний об орфографии.
Long Муж.
SubAdmin
Теоретик
17
Сообщения: 4362
Зарегистрирован: 25.04.01
Откуда: Москва
Сообщение Добавлено: 25 Апрель 2003, 10:38:34 
hokum, разница только в том, что у тебя ссылка на сам фильтр :) не из того окна скопировал, бывает :laugh:

_________________
Мудрость не всегда приходит с возрастом. Бывает, что возраст приходит один.
arlekino Муж.
соучастник
5
Сообщения: 481
Зарегистрирован: 05.07.01
Откуда: Москва
Сообщение Добавлено: 25 Апрель 2003, 11:18:08 

Akela писал(а):
Лето
...Но в общем и целом - не нужно форматировать его в Ворде НИКОГДА и всё будет прекрасно. Сохраняете как текст, потом этот текст пихаете например в тот же Дрим. А на смом деле всё равно придётся руками доделывать...


Часто материалы присылают именно в виде вордовского файла. Наверно у Лето именно такой случай.

Насчет фильтра - если (в самом ворде) удалить стили, оформление и прочую шелуху, документ можно сжать в три, а то и четыре раза. В любом случае фильтр полезная вещь, рекомендую.
Лето
новый человек
0
Сообщения: 7
Зарегистрирован: 19.04.03
Сообщение Добавлено: 25 Апрель 2003, 11:26:02 
Спасибо огромное всем, кто откликнулся!

Microsoft Office HTML Filter действительно та программа, про которую я слышала. Правда она не работает с Office МХ, :) но это уже мелочи.:)
Сейчас попробую все методы.
Вы очень помогли!
Akela
Констататор
12
Сообщения: 3239
Зарегистрирован: 03.05.02
Откуда: Европа
Сообщение Добавлено: 25 Апрель 2003, 11:28:37 
arlekino, я же не говорил НЕ ПОЛЬЗОВАТЬСЯ Вордом! Я сказал НЕ ФОРМАТИРОВАТЬ в нём! :) Имхо saveAs --> text plain никто не отменял? А для форматирования HTML придумано множество прекрасных программ. Но это уже другая история... :)
*   Список форумов / Начинка и техника / Программирование для WWW « | » » ответить » создать топик
 Страница 1 из 1 [ Сообщений: 16 ] 
Показать сообщения за:   Поле сортировки  
Найти:
Перейти:  
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.
cron


ООО ДеФорум
При использовании материалов сайта ссылка на DeForum.ru — обязательна.
Проект Павла Батурина ©2001-2077; // Powered by phpBB © 2013 phpBB Group
Rambler's Top100