2008-07-29

Программа очистки HTML от мусора Word. [cleaning HTML from the Word cruft]


Качаем проект FW2.0 Visual Studio 2005, C#. [<-Load VS project, C#] Программа проводит чистку в пакетном режиме сгенерированного в Word HTML кода от мусора. В результате объем файла сокращается как минимум на 2/3. Применён алгоритм, найденный мной на http://www.codinghorror.com/blog/archives/000485.html. Я слегка модифицировал код, чтобы корректно чистился кириллический HTML, и добавил пакетный режим.
Здесь инсталлятор [<-Download Setup Files MS Framework 2.0 required].
После чистки размер файла сократился с 17 Мб до 1,6 Мб!

1 comments:

Михаил said...

вроде таблицу прочистил. Буду экспериментировать на таблицах из своего сайта(www.L1957.ru), а то задолбало html-таблицы править, лучше их править в Ворде.

Post a Comment