Page 6 of 59
Re: HTML Viewer in C--
Posted: Mon Oct 20, 2008 6:14 pm
by ДедОк
вот, символы (R)(C), это байты FB и FC соответственно... и вернул недостающие украинские буквы...

Re: HTML Viewer in C--
Posted: Thu Oct 23, 2008 2:32 pm
by Asper
Если перейти по ссылке, потом нажать кнопку назад и потом кнопку обновить ссылки перестают работать.
Re: HTML Viewer in C--
Posted: Thu Oct 23, 2008 2:36 pm
by Leency
Хм... У меня ссылки остались рабочими, а вот кнопка назад перестала работать.
Re: HTML Viewer in C--
Posted: Thu Oct 23, 2008 2:53 pm
by Asper
Уточняю: один раз ещё перейти по ссылке можно но потом нельзя ни по ссылке ни назадю. Если поменять последовательность действий: 1. переход по ссылке; 2. кнопка обновить; 3. кнопка назад, то получаем тот же результат.
Re: HTML Viewer in C--
Posted: Thu Oct 23, 2008 2:54 pm
by Leency
Спасибо. Буду разбираться...
Re: HTML Viewer in C--
Posted: Sat Nov 01, 2008 6:42 pm
by Albom
вот некоторая инфа по UTF-8. надеюсь, найдёт применение.
Re: HTML Viewer in C--
Posted: Sun Nov 02, 2008 11:24 pm
by iwfriends
как предложение для парсинга страницы использовать RegExp. Не уверен что в данной реализации можно с легкостью его ввернуть и имеет смысл его вворачивать, но я всего-лишь предложил.

Re: HTML Viewer in C--
Posted: Wed Nov 12, 2008 10:07 am
by Albom
Leency
Как тебе такая страничка? (официальная страничка организации, где я работаю) Сможешь реализовать её отображение?

Re: HTML Viewer in C--
Posted: Tue Dec 02, 2008 6:51 am
by Leency
HTML Viewer v0.45
- поддержка кодировки KOI8-R(U) - активируется нажатием Ctrl+R. Спасибо Veliant'y за написаный код;
- вывод какой-то win кодировки, где все символы отображаются, как А и т.д. (заработал файл, присланый Albom'ом);
- исправлен очень серьёзный баг из-за которого страницы с большим количеством ссылок приводили к вылеталу программы;
- кодировка DOS'a (CPP866) активируется нажатием Ctrl+D;
- улучшен скролл;
- исправлен баг кнопки "Обновить";
- иконки тулбара выводится одним изображением с палитрой, как результат меньше перерисовка окна и размер программы.
Re: HTML Viewer in C--
Posted: Tue Dec 02, 2008 6:57 am
by Leency
Albom wrote:Leency
Как тебе такая страничка? (официальная страничка организации, где я работаю) Сможешь реализовать её отображение?

Как оказалось надо-то было всего две строчки:
//например "#1072" преобразовываем в число, отнимаем 1040 и берём с масива соответствующий символ
unsigned char win10_mas[] = "АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюя";
bukva=win10_mas[StrToInt(#text+1)-1040];
Но писал я их долго)) Сказывается малое количество опыта... Меня врохновила процедура koitodos(), написаная Veliant'ом. Даже не думал что всё получится настолько просто и аккуратно.
Re: HTML Viewer in C--
Posted: Tue Dec 02, 2008 1:52 pm
by diamond
Leency wrote:вывод какой-то win кодировки, где все символы отображаются, как А и т.д.
Это не "какая-то win кодировка", это Unicode. Кстати, там ещё бывают буквы Ё и ё.
Leency wrote:unsigned char win10_mas[] = "АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюя";
bukva=win10_mas[StrToInt(#text+1)-1040];
Тогда рекомендую помедитировать над вопросом: что будет, если браузер наткнётся на, скажем, "Ѐ" или "�"...
Re: HTML Viewer in C--
Posted: Tue Dec 02, 2008 5:48 pm
by Leency
diamond wrote:Это не "какая-то win кодировка", это Unicode. Кстати, там ещё бывают буквы Ё и ё.
Я тоже так думал, но меня ввела в заблуждение строка "charset=windows-1252" на той странице. О Ё и ё я догадывался, потом прикручу.
diamond wrote:Тогда рекомендую помедитировать над вопросом: что будет, если браузер наткнётся на, скажем, "Ѐ" или "�"...
Ты обо мне слишком плохого мнения

Во-первых, "�" такого быть не может, т.к. все такие теги меньше 7 символов. Далее, на самом деле, стоит проверка:
IF (text[1]=='1') && (text[2]=='0') bukva=win10_mas[StrToInt(#text+1)-1040];
И даже если будет "Ѐ" или "
h4;" всё равно прога не вылетит. Я проверял.
Re: HTML Viewer in C--
Posted: Tue Dec 02, 2008 7:57 pm
by Ghost
Leency
В хтмл может быть что угодно, ❿ очень даже запросто (да, смысла не имеет, но может быть), это все равно что требывание писать все атрибуты в двойных кавычках, чего многие не придерживаются как и многих других вещей. Пишеш хтмл просмотрщьк почитай хотя бы про него, &#****; - Unicode символ, без разници какая кодировка стоит, частенько используется например для символа копирайта и трейд марк.
Re: HTML Viewer in C--
Posted: Tue Dec 02, 2008 8:17 pm
by Leency
Я меньше читаю, зато больше пишу. Всё познаётся сперва на практике ,потом уже можно и теорию глянуть, тогда хоть будет интересно что в ней.
Если так посмотреть, этих юникеодовских кодировой дофига. На самом деле я реализовал ещё одну, но удалил код, т.к. порыскав в нэте понял что с ней не более 2000 страниц.
Re: HTML Viewer in C--
Posted: Wed Dec 03, 2008 8:28 am
by Ghost
На самом деле Unicode одно, остальное (UTF7/8/16/32, UC2, UC4) лишь подмножество, с некоторыми хитростями совместимое с юникодом.
P.S. Вот вспомнил полезную тебе вещь, как в Битрикс сделано перекодирование из любой кодировки в любую. Там есть просто куча файлов с описание преобразований нужной кодировки в юникод и обратно
(это самое полезное для тебя), и функция вида convert(что, из, в); ей говорится например $str866 = convert($str, "cp1251", "cp866"); она берет $str конвертит из "cp1251" в юникод, потом из юникода в "cp866", все гениальное просто ))))