Author Topic: Сколько данных можно запихать в текстовый файл?  (Read 160 times)

Offline Yougi

  • Ветеран
  • *****
  • Posts: 1535
  • Карма: +207/-63
    • View Profile
 Вопрос в топике не совсем соответствует тому, что я хочу спросить, но шо маэмо....
 Итак
 В плане радикального обновления карельского онлайн словаря навалял я себе на жабоскрипте некий код, а данные к нему хранятся прямо в файле скрипта, типа вот так
Code: [Select]

var dictionary = [
{
word: "kehno",
def: "черт",
rel: ["piru", "juavali","sorta"]
},
{
word: "ruočči",
def: "швед",
rel: ["počči", "emäččy"]
},
{
word: "perkele",
def: "ругательство",
rel: ["saattana", "сволочь"]
},
{
word: "käbälä",
def: "лапа",
rel: ["sorki", "jalka"]
},
{
word: "perze",
def: "жопа",
rel: ["makkura", "takapuoli"]
},
так вот, вопрос в том - если записей будет не сотня, а несколько тысяч, да и сами записи не такие убогие, а по килобайту каждая - оно  не поломается?

Online Tanuki-san

  • Администратор
  • Трижды герой
  • *****
  • Posts: 36231
  • Карма: +5165/-480
    • View Profile
могу сказать с практической стороны, что частотный словарь японского на 50к записей в виде txt зависал и не отвисал при попытке что-то в нем искать ctrl+F. надо иметь в виду, что кандзи в 2х больше места занимают, чем символ латиницы, но факт

Online Tanuki-san

  • Администратор
  • Трижды герой
  • *****
  • Posts: 36231
  • Карма: +5165/-480
    • View Profile
а сама структура записи - элементарнейшая:

# по ранкингу - слово - число токенов в корпусе

ничего особенного собственно

Offline 2Easy

  • Дважды герой
  • **
  • Posts: 7119
  • Карма: +933/-156
    • View Profile
Вопрос в топике не совсем соответствует тому, что я хочу спросить, но шо маэмо....
 Итак
 В плане радикального обновления карельского онлайн словаря навалял я себе на жабоскрипте некий код, а данные к нему хранятся прямо в файле скрипта, типа вот так
Code: [Select]

var dictionary = [
{
word: "kehno",
def: "черт",
rel: ["piru", "juavali","sorta"]
},
{
word: "ruočči",
def: "швед",
rel: ["počči", "emäččy"]
},
{
word: "perkele",
def: "ругательство",
rel: ["saattana", "сволочь"]
},
{
word: "käbälä",
def: "лапа",
rel: ["sorki", "jalka"]
},
{
word: "perze",
def: "жопа",
rel: ["makkura", "takapuoli"]
},
так вот, вопрос в том - если записей будет не сотня, а несколько тысяч, да и сами записи не такие убогие, а по килобайту каждая - оно  не поломается?
В обычном виндяшном блокноте большой текстовый файл будет виснуть, в Notepad++ у меня еще ничего не висло.

Offline Bhudh

  • Дважды герой
  • **
  • Posts: 8465
  • Карма: +2815/-617
    • View Profile
Поскольку структура JSON-подобная, её можно в .json-файле хранить и подгружать по мере надобности.
Или в .js, но тогда в нём надо оставить приравнивание переменной и подгружать через
<script src="dictionary.js"></script>
Jestem dokładny i dociekliwy. (Wg Pinii.)
Всё, что нужно для торжества зла — это бездействие добрых людей. Поэтому бездействовать не надо. Алексей Навальный
Ceterum censeo gebniam esse delendam.
…Когда ты чем-то не интересуешься, то после шокового события ты готов принять любую удобную интерпретацию, которую тебе предложат. Григорий Юдин

Offline Python

  • Постоялец
  • ***
  • Posts: 406
  • Карма: +120/-9
    • View Profile
Гігантський JSON точно можна читати фрагментами, не парсячи кожного разу його увесь? Крім того, текст в UTF-8 — змінний розмір символів ускладнює навігацію по файлу.

Online Upliner

  • Администратор
  • Дважды герой
  • *****
  • Posts: 6039
  • Карма: +655/-27
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Гігантський JSON точно можна читати фрагментами, не парсячи кожного разу його увесь?
Не знаю як у JS, але в Go можна.
Вход в Московское княжество -- 1 рубль, выход -- бесценен.
Византийский цирк уехал, а клоуны остались среди русских.
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Bhudh

  • Дважды герой
  • **
  • Posts: 8465
  • Карма: +2815/-617
    • View Profile
Файл .json подгружается сразу весь, другое дело, что его можно разбить на несколько отдельных файлов (по алфавиту, частотности &c.) и подгружать данные пофайлово. Если нужно для работы держать данные в одном объекте, написать простенькую функцию объединения типа питоновской update.
Jestem dokładny i dociekliwy. (Wg Pinii.)
Всё, что нужно для торжества зла — это бездействие добрых людей. Поэтому бездействовать не надо. Алексей Навальный
Ceterum censeo gebniam esse delendam.
…Когда ты чем-то не интересуешься, то после шокового события ты готов принять любую удобную интерпретацию, которую тебе предложат. Григорий Юдин

Offline Чайник777

  • Жестянщик
  • Дважды герой
  • **
  • Posts: 8001
  • Карма: +469/-633
    • View Profile
В общем, скорее всего, данные лучше хранить отдельно от кода  :)
Botho Lukas Chor!!!