Author Topic: Сколько данных можно запихать в текстовый файл?  (Read 34 times)

Offline Yougi

  • Ветеран
  • *****
  • Posts: 1534
  • Карма: +206/-63
    • View Profile
 Вопрос в топике не совсем соответствует тому, что я хочу спросить, но шо маэмо....
 Итак
 В плане радикального обновления карельского онлайн словаря навалял я себе на жабоскрипте некий код, а данные к нему хранятся прямо в файле скрипта, типа вот так
Code: [Select]

var dictionary = [
{
word: "kehno",
def: "черт",
rel: ["piru", "juavali","sorta"]
},
{
word: "ruočči",
def: "швед",
rel: ["počči", "emäččy"]
},
{
word: "perkele",
def: "ругательство",
rel: ["saattana", "сволочь"]
},
{
word: "käbälä",
def: "лапа",
rel: ["sorki", "jalka"]
},
{
word: "perze",
def: "жопа",
rel: ["makkura", "takapuoli"]
},
так вот, вопрос в том - если записей будет не сотня, а несколько тысяч, да и сами записи не такие убогие, а по килобайту каждая - оно  не поломается?

Offline Tanuki-san

  • Администратор
  • Трижды герой
  • *****
  • Posts: 36205
  • Карма: +5157/-479
    • View Profile
могу сказать с практической стороны, что частотный словарь японского на 50к записей в виде txt зависал и не отвисал при попытке что-то в нем искать ctrl+F. надо иметь в виду, что кандзи в 2х больше места занимают, чем символ латиницы, но факт

Offline Tanuki-san

  • Администратор
  • Трижды герой
  • *****
  • Posts: 36205
  • Карма: +5157/-479
    • View Profile
а сама структура записи - элементарнейшая:

# по ранкингу - слово - число токенов в корпусе

ничего особенного собственно