Автор Тема: Задачка по html  (Прочитано 2404 раз)

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #15 : 14 Апреля 2020, 00:35:30 »
  • 0
  • 0
 >o< короче всё получилось, теперь два вопроса.

1. Безопасно ли хранить важную информацию в старых кодировках? Могут ли их "отключить" со временем? Если так, то как мне теперь проконвертировать html файл из одной кодировки в другую?

2. Я абсолютный ноль в ccs, мне как-то интуитивнее с прямыми тагами вроде <font> работать. Возможно ли вообще так поставить таги, чтобы только текст был определённого размера, но не цифры?  ??? Проблема в том, что в редких иерогах куча мелких черт, и мне их удобнее при размере 5 наблюдать, а вот цифры такого гигантского размера мне глаза ломают. Я их оставил бы размера "3". Можно такое как-то сделать?

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #16 : 14 Апреля 2020, 00:38:03 »
  • 0
  • 0
За наводку на Notepad++  особое спасибо, я давно искал, в чём было бы удобно редактировать страницы :drink

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Задачка по html
« Ответ #17 : 14 Апреля 2020, 00:40:57 »
  • 0
  • 0
1. Безопасно ли хранить важную информацию в старых кодировках? Могут ли их "отключить" со временем? Если так, то как мне теперь проконвертировать html файл из одной кодировки в другую?
Есть небольшая вероятность, что новых версиях программ старых кодировок уже не будет. Если вы скопировали текст в Notepad++, то по умолчанию он сохранится в UTF8.
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Задачка по html
« Ответ #18 : 14 Апреля 2020, 00:57:27 »
  • 0
  • 0
2. Я абсолютный ноль в ccs, мне как-то интуитивнее с прямыми тагами вроде <font> работать. Возможно ли вообще так поставить таги, чтобы только текст был определённого размера, но не цифры?  ??? Проблема в том, что в редких иерогах куча мелких черт, и мне их удобнее при размере 5 наблюдать, а вот цифры такого гигантского размера мне глаза ломают. Я их оставил бы размера "3". Можно такое как-то сделать?
Если без css -- можно весь текст загнать в тег <font size="5">, а цифры дополнительно загнать в тег <font size="3"> с помощью той же автозамены: (первая сточка -- Find what, вторая -- Replace with)
(\d+)
<font size="3">\1</font>
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #19 : 14 Апреля 2020, 00:58:10 »
  • 0
  • 0
Есть небольшая вероятность, что новых версиях программ старых кодировок уже не будет. Если вы скопировали текст в Notepad++, то по умолчанию он сохранится в UTF8.
В смысле "скопировать"? Я его просто открыл с помощью Notepad++. Там в самом файле вот такая "кодировка":

¤Î   3711420<br/>
¤Ï   1950996<br/>
¤¿   1736532<br/>
¤Ë   1711256<br/>
¤¬   1678863<br/>
¤¹¤ë   1616566<br/>
¤È   1292531<br/>
¤Æ   1251528...

Это только хром уже преобразует по тегу <meta charset="ABC">. Как-то по-другому надо сделать? ???

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #20 : 14 Апреля 2020, 01:04:54 »
  • 0
  • 0
Попробовал тупо сохранить уже из браузера, одной страницей. файл раздулся в 3 раза до 4.5М, а иероги, насколько я понимаю, сохраняются теперь 16ричным кодом с много "=". Кодировка, как вижу, сохранена EUC-JP. Короче полная лажа  :(

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Задачка по html
« Ответ #21 : 14 Апреля 2020, 01:12:50 »
  • 0
  • 0
Попробовал тупо сохранить уже из браузера, одной страницей. файл раздулся в 3 раза до 4.5М, а иероги, насколько я понимаю, сохраняются теперь 16ричным кодом с много "=". Кодировка, как вижу, сохранена EUC-JP. Короче полная лажа  :(
А copy-paste-ом из браузера не получается скопировать в Notepad++?
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #22 : 14 Апреля 2020, 01:20:43 »
  • 0
  • 0
попробую

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #23 : 05 Мая 2020, 20:27:31 »
  • 0
  • 0
Новая проблема. Есть вот такая страница: https://accent.u-biq.org/a.html Это только буква "А" словаря, ещё есть остальные 45 букв алфавита + имена, географические названия и т.д. (меню справа).

Это словарь ударений и как вы видите красной разметкой расчерчен контур. Сохранить в виде отдельных страниц можно, но лучше импортировать в Эксель, так как а) надо интегрировать с другими словарями б) искать что-то по 60 отдельным файлам более, чем неудобно.

Проблема: как можно догадаться - сама красная разметка, при тупом копировании она теряется, а она как бы и есть суть словаря. Она организована следующим образом: каждая часть слова с разным тоном обрамлена тегами типа <span class=3D"аX">АБВ....</span>, где X =(1..4) в зависимости от начертания, 1= подчеркивание снизу и подъём вверх после слога, 2 - надчёркивание и спуск, 3 - подчёркивание (без подъёма), 4 - надчёркивание (без спуска).   

Я думал открыть страницу в Notepad’e++ и выкопировать оттуда, заменяя <span> тем, чем мне надо уже в Экселе. Проблема в том, что все японские символы хранятся в виде html reference и при экспортировании они остаются в виде =A2[ и т.д. А дальше как?

Можно как-нибудь заставить  Notepad++ преобразовать html reference в сами символы? Кодировка файла Shift-JIS
« Последнее редактирование: 05 Мая 2020, 22:37:54 от Gaeilgeoir »

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #24 : 07 Мая 2020, 21:26:48 »
  • 0
  • 0
Решения нет?  :(

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Задачка по html
« Ответ #25 : 07 Мая 2020, 21:28:30 »
  • 0
  • 0
Забыл. Сейчас посмотрю...
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Задачка по html
« Ответ #26 : 07 Мая 2020, 21:36:40 »
  • 0
  • 0
Честно говоря, я в файле никаких html reference не вижу, экспортировал с Хрома. Так что либо это какой-то глюк при экспорте, либо я что-то не так понял...
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Задачка по html
« Ответ #27 : 07 Мая 2020, 21:42:17 »
  • 0
  • 0
Кстати =A2[ это явно не html reference, больше похоже на почтовую кодировку. Вы случайно не в eml сохраняли?
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #28 : 08 Мая 2020, 01:43:47 »
  • 0
  • 0
Честно говоря, я в файле никаких html reference не вижу, экспортировал с Хрома. Так что либо это какой-то глюк при экспорте, либо я что-то не так понял...
Я сохранил страницу из Хрома и открыл Notepad'ом, вместо японских символом html reference ("=81@" и похожее). Как сохранить файл так, чтобы открыв его NPP были сами символы, а не их коды? 
« Последнее редактирование: 08 Мая 2020, 01:46:19 от Gaeilgeoir »

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Задачка по html
« Ответ #29 : 08 Мая 2020, 01:45:53 »
  • 0
  • 0
Кстати =A2[ это явно не html reference, больше похоже на почтовую кодировку. Вы случайно не в eml сохраняли?
возможно это прелести Shift-JIS, я никогда в документацию японских кодировок не вникал. Сайт старый, 2010 года, так что неудивительно, что там не UTF-8, который в Японии начал приживаться сравнительно недавно