Автор Тема: Сортировка кандзей  (Прочитано 1064 раз)

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Сортировка кандзей
« : 28 Апреля 2020, 15:27:02 »
  • 0
  • 0
Наклюнулась новая проблема: по какой логике уомпьютеры сортируют кандзи  :( что-то читал я, читал, но так и не понял  |< кто-нибудь знает?

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Сортировка кандзей
« Ответ #1 : 28 Апреля 2020, 18:28:13 »
  • 0
  • 0
Разве не по порядку их нахождения в юникоде?
https://unicode-table.com/en/#cjk-unified-ideographs
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Сортировка кандзей
« Ответ #2 : 28 Апреля 2020, 22:23:03 »
  • 0
  • 0
Или имеется в виду по какой логике их разместили в юникоде?
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Сортировка кандзей
« Ответ #3 : 29 Апреля 2020, 00:56:25 »
  • 0
  • 0
Разве не по порядку их нахождения в юникоде?
https://unicode-table.com/en/#cjk-unified-ideographs
нет, её сортируют в зависимости от того, как она была введена, например, в Эксель. Если набирать вручную, то Эксель запоминает фонетическую последовательность и сортирует вместе с хираганой. А если взято откуда-то копи-пастом, то будет сортировать юникодом. В результате идентичный иерог сортируется в два разных места, в зависимости от того, как он попал в Эксель :o Я погуглил по теме подробнее, консенсус такой, что на сегодняшний день проблема сортировки японского принципиально не решаема. Единственное решение: создание второго поля вручную и сортировка по нему  :( 

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Сортировка кандзей
« Ответ #4 : 29 Апреля 2020, 02:03:44 »
  • 0
  • 0
В результате идентичный иерог сортируется в два разных места, в зависимости от того, как он попал в Эксель
Интересно посмотреть на такой файл...
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Сортировка кандзей
« Ответ #5 : 29 Апреля 2020, 02:19:19 »
  • 0
  • 0
Ещё есть вариант, что при копи-пасте язык может ошибочно определяться как китайский.
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Сортировка кандзей
« Ответ #6 : 29 Апреля 2020, 03:28:06 »
  • 0
  • 0
Ещё есть вариант, что при копи-пасте язык может ошибочно определяться как китайский.
нет, это - просто косяк от Майкрософта, они хотели как лучше, сделали как всегда. В идее использовать ввод самого юзера для собирания фонетической информации есть рациональное зерно, но не продумано, что у списков (которые чаще всего и надо сортировать) больше шансов быть импортированными, чем введёнными вручную.

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Сортировка кандзей
« Ответ #7 : 29 Апреля 2020, 03:29:43 »
  • 0
  • 0
Интересно посмотреть на такой файл...
там к клеткам с японскими символами крепится мета-разметка с фонетиками использованными для ввода. "Вручную" в Экселе её невидно, наверное, надо как-то хитро экспортировать, чтобы она была видна. Если информация была импортирована, то разметка пустая и в сортировке не участвует

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Сортировка кандзей
« Ответ #8 : 29 Апреля 2020, 03:39:23 »
  • 0
  • 0
"Вручную" в Экселе её невидно, наверное, надо как-то хитро экспортировать, чтобы она была видна.
Можно же просто сохранить в xlsx и посмотреть все метаданные...
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Сортировка кандзей
« Ответ #9 : 29 Апреля 2020, 03:54:49 »
  • 0
  • 0
Всё, нашёл, как выглядят метки фонетиков в экселевском файле.
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Upliner

  • Администратор
  • Дважды герой
  • *****
  • Сообщений: 2581
  • Карма: +6/-0
  • Пол: Мужской
  • Кис-кис-кис!
    • Просмотр профиля
    • лифчег
Re: Сортировка кандзей
« Ответ #10 : 29 Апреля 2020, 04:01:59 »
  • 0
  • 0
В принципе, упираемся в эту же проблему:
В принципе жить с ними можно, но личные имена - это всё-таки трабл. Например, 襄 - это и тов. Джо, и тов. Нобору (!!!). Как они читают чужие имена обменявшись визитками - для меня это мистика. Сколько я слышал, переспросить чужое имя - страшное оскорбление.
Пацаки, а пацаки? А вы почему не в намордниках? Приказ господина ПЖ -- всем пацакам одеть намордники! (с)

Новий лох, новий даун, все це станеться іще раз, так як на початку, хай триває далі цирк...

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Сортировка кандзей
« Ответ #11 : 29 Апреля 2020, 23:26:27 »
  • 0
  • 0
Вот ещё "красавец" по теме: 愛. Как иерог - ничего особенного, чаще всего читается "ай" и значит "любовь". А вот как женское имя :o :
Цитировать
Azumi or Āi or Aika or Aisu or Aki or Ako or Amika or Aoi or Arisa or Aya or Ayu or Chigiri or Chika or Chikashi or Erina or Hāto or Hikari or Ito or Itoshi or Itsumi or Izumi or Kana or Kanae or Kanasa or Kizuna or Kokoro or Konomu or Madoka or Manabu or Manami or Mezuru or Mego or Megu or Megumi or Megumu or Mei or Naru or Naruko or Nozomi or Rabu or Rui or Sara or Saran or Tsugumi or Tsukumi or Ui or Yoshi or Yoshiki or Yoshimi

боюсь, что список неполный  :'(
« Последнее редактирование: 29 Апреля 2020, 23:31:18 от Gaeilgeoir »

Оффлайн Gaeilgeoir

  • Глобальный модератор
  • Трижды герой
  • *****
  • Сообщений: 6542
  • Карма: +42/-12
    • Просмотр профиля
Re: Сортировка кандзей
« Ответ #12 : 29 Апреля 2020, 23:34:51 »
  • 0
  • 0
Погуглив этот иерог в более порядочном словаре:
Цитировать
Names — 2371 found
:fp |<

Апдейт: в принципе всем японским девочкам можно давать "одно" имя, выраженное только этим одним иерогом, разнообразия будет больше, чем в большинстве стран мира  :fp
« Последнее редактирование: 29 Апреля 2020, 23:37:55 от Gaeilgeoir »