Author Topic: Задачка по html  (Read 5891 times)

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #15 on: 14 April 2020, 00:35:30 »
  • 0
  • 0
 >o< короче всё получилось, теперь два вопроса.

1. Безопасно ли хранить важную информацию в старых кодировках? Могут ли их "отключить" со временем? Если так, то как мне теперь проконвертировать html файл из одной кодировки в другую?

2. Я абсолютный ноль в ccs, мне как-то интуитивнее с прямыми тагами вроде <font> работать. Возможно ли вообще так поставить таги, чтобы только текст был определённого размера, но не цифры?  ??? Проблема в том, что в редких иерогах куча мелких черт, и мне их удобнее при размере 5 наблюдать, а вот цифры такого гигантского размера мне глаза ломают. Я их оставил бы размера "3". Можно такое как-то сделать?

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #16 on: 14 April 2020, 00:38:03 »
  • 0
  • 0
За наводку на Notepad++  особое спасибо, я давно искал, в чём было бы удобно редактировать страницы :drink

Online Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4944
  • Карма: +433/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Задачка по html
« Reply #17 on: 14 April 2020, 00:40:57 »
  • 0
  • 0
1. Безопасно ли хранить важную информацию в старых кодировках? Могут ли их "отключить" со временем? Если так, то как мне теперь проконвертировать html файл из одной кодировки в другую?
Есть небольшая вероятность, что новых версиях программ старых кодировок уже не будет. Если вы скопировали текст в Notepad++, то по умолчанию он сохранится в UTF8.
Дві найголовніші помилки українського народу -- зек і зєк.

Online Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4944
  • Карма: +433/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Задачка по html
« Reply #18 on: 14 April 2020, 00:57:27 »
  • 0
  • 0
2. Я абсолютный ноль в ccs, мне как-то интуитивнее с прямыми тагами вроде <font> работать. Возможно ли вообще так поставить таги, чтобы только текст был определённого размера, но не цифры?  ??? Проблема в том, что в редких иерогах куча мелких черт, и мне их удобнее при размере 5 наблюдать, а вот цифры такого гигантского размера мне глаза ломают. Я их оставил бы размера "3". Можно такое как-то сделать?
Если без css -- можно весь текст загнать в тег <font size="5">, а цифры дополнительно загнать в тег <font size="3"> с помощью той же автозамены: (первая сточка -- Find what, вторая -- Replace with)
(\d+)
<font size="3">\1</font>
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #19 on: 14 April 2020, 00:58:10 »
  • 0
  • 0
Есть небольшая вероятность, что новых версиях программ старых кодировок уже не будет. Если вы скопировали текст в Notepad++, то по умолчанию он сохранится в UTF8.
В смысле "скопировать"? Я его просто открыл с помощью Notepad++. Там в самом файле вот такая "кодировка":

¤Î   3711420<br/>
¤Ï   1950996<br/>
¤¿   1736532<br/>
¤Ë   1711256<br/>
¤¬   1678863<br/>
¤¹¤ë   1616566<br/>
¤È   1292531<br/>
¤Æ   1251528...

Это только хром уже преобразует по тегу <meta charset="ABC">. Как-то по-другому надо сделать? ???

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #20 on: 14 April 2020, 01:04:54 »
  • 0
  • 0
Попробовал тупо сохранить уже из браузера, одной страницей. файл раздулся в 3 раза до 4.5М, а иероги, насколько я понимаю, сохраняются теперь 16ричным кодом с много "=". Кодировка, как вижу, сохранена EUC-JP. Короче полная лажа  :(

Online Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4944
  • Карма: +433/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Задачка по html
« Reply #21 on: 14 April 2020, 01:12:50 »
  • 0
  • 0
Попробовал тупо сохранить уже из браузера, одной страницей. файл раздулся в 3 раза до 4.5М, а иероги, насколько я понимаю, сохраняются теперь 16ричным кодом с много "=". Кодировка, как вижу, сохранена EUC-JP. Короче полная лажа  :(
А copy-paste-ом из браузера не получается скопировать в Notepad++?
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #22 on: 14 April 2020, 01:20:43 »
  • 0
  • 0
попробую

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #23 on: 05 May 2020, 20:27:31 »
  • 0
  • 0
Новая проблема. Есть вот такая страница: https://accent.u-biq.org/a.html Это только буква "А" словаря, ещё есть остальные 45 букв алфавита + имена, географические названия и т.д. (меню справа).

Это словарь ударений и как вы видите красной разметкой расчерчен контур. Сохранить в виде отдельных страниц можно, но лучше импортировать в Эксель, так как а) надо интегрировать с другими словарями б) искать что-то по 60 отдельным файлам более, чем неудобно.

Проблема: как можно догадаться - сама красная разметка, при тупом копировании она теряется, а она как бы и есть суть словаря. Она организована следующим образом: каждая часть слова с разным тоном обрамлена тегами типа <span class=3D"аX">АБВ....</span>, где X =(1..4) в зависимости от начертания, 1= подчеркивание снизу и подъём вверх после слога, 2 - надчёркивание и спуск, 3 - подчёркивание (без подъёма), 4 - надчёркивание (без спуска).   

Я думал открыть страницу в Notepad’e++ и выкопировать оттуда, заменяя <span> тем, чем мне надо уже в Экселе. Проблема в том, что все японские символы хранятся в виде html reference и при экспортировании они остаются в виде =A2[ и т.д. А дальше как?

Можно как-нибудь заставить  Notepad++ преобразовать html reference в сами символы? Кодировка файла Shift-JIS
« Last Edit: 05 May 2020, 22:37:54 by Gaeilgeoir »

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #24 on: 07 May 2020, 21:26:48 »
  • 0
  • 0
Решения нет?  :(

Online Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4944
  • Карма: +433/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Задачка по html
« Reply #25 on: 07 May 2020, 21:28:30 »
  • 0
  • 0
Забыл. Сейчас посмотрю...
Дві найголовніші помилки українського народу -- зек і зєк.

Online Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4944
  • Карма: +433/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Задачка по html
« Reply #26 on: 07 May 2020, 21:36:40 »
  • 0
  • 0
Честно говоря, я в файле никаких html reference не вижу, экспортировал с Хрома. Так что либо это какой-то глюк при экспорте, либо я что-то не так понял...
Дві найголовніші помилки українського народу -- зек і зєк.

Online Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4944
  • Карма: +433/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Задачка по html
« Reply #27 on: 07 May 2020, 21:42:17 »
  • 0
  • 0
Кстати =A2[ это явно не html reference, больше похоже на почтовую кодировку. Вы случайно не в eml сохраняли?
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #28 on: 08 May 2020, 01:43:47 »
  • 0
  • 0
Честно говоря, я в файле никаких html reference не вижу, экспортировал с Хрома. Так что либо это какой-то глюк при экспорте, либо я что-то не так понял...
Я сохранил страницу из Хрома и открыл Notepad'ом, вместо японских символом html reference ("=81@" и похожее). Как сохранить файл так, чтобы открыв его NPP были сами символы, а не их коды? 
« Last Edit: 08 May 2020, 01:46:19 by Gaeilgeoir »

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 28985
  • Карма: +3989/-330
    • View Profile
Re: Задачка по html
« Reply #29 on: 08 May 2020, 01:45:53 »
  • 0
  • 0
Кстати =A2[ это явно не html reference, больше похоже на почтовую кодировку. Вы случайно не в eml сохраняли?
возможно это прелести Shift-JIS, я никогда в документацию японских кодировок не вникал. Сайт старый, 2010 года, так что неудивительно, что там не UTF-8, который в Японии начал приживаться сравнительно недавно