Show Posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.


Messages - Euskaldun

Pages: 1 ... 446 447 [448] 449 450 ... 1953
6706
Но зачем при этом лингвисту писать UI для айфона - убей не пойму. Если вы даже не занимаетесь нейронками, каким образом лингвистика пересекается с программированием?
ну вот вы как инженер имеете какую-то идею, насчет того как улучшить ML (забудем пока про нейронки, какая-то нездоровая на них фиксация) - вы набросали быстренько алгоритм и что дальше? Вы взяли гоблинов-аннотаторов в качестве лабораторных мышей. Как вы будете эксперименты проводить? сажать людей, которые только умеют мышкой кликать за DOS-овский терминал? Или предложите им самим писать эскьюэльки, чтобы вытаскивать кейсы из БД? Ну вот реально, какие вы видите сценарии?
  • 0
  • 0

6707
это ж метафора, хоть и гуглобайты - какая разница :)
  • 0
  • 0

6708
В Basic табы не синтагматичны.
вы о деталях, а я о принципах. интерпретатор, а не компилятор, построчное исполнение, конец строки - конец высказывания, при ошибке - стоп на строке с ощибкой и т.д. Пока что бейсик - бейсиком ??? :-\
  • 0
  • 0

6709
мне только кажется, или Питон очень похож на Бейсик? :o
  • 0
  • 0

6710
То, что вы написали - чистая правда, но это - типичная тз программистов: натаскали нейронку - и вот, кушайте не обляпайтесть :) Я вам приведу достаточно нашумевший пример, может слышали. Определенное время назад ТикТоки были завалены такими мемами: юзер просит Алису «Чип и Дейл спешат на помощь» (мультфильм из 90ых), а Алиса (ваша натасканная нейронка) звонит в службы спасения. Наверняка, реагирует на ключевые слова «спешат на вопрос». Вопрос: кто виноват? и второй вопрос: что делать?  :) Так что, если серьезно заниматься ИИ, то это только кажется: натаскали нейронку на пентабайтах даты = профит, в реальной жизни всё не так. Какие бы нейронки ни были «умные», сначала, как оказалось, надо их научить определять домейн запроса, прежде чем позволять что-то «думать». И таких тонкостей миллионы, и именно тут нужны лингвисты, чтобы выхватить «суть» языкового запроса, никакие пентабайты не помогут с этим, брутал-форс фейлит с живыми языками, увы
  • 0
  • 0

6711
короче, подсмотрел, что Питоне то, что выше - print (“Hello”)  :lol:

начну-ка я с Питона, попроще будет
  • 0
  • 0

6712

Даже нельзя сказать, обучаете ли вы нейронки
нет, конечно. я же писал - я не инженер и такой цели нет у меня.

 
Quote
Разметка же основное время занимает. Не знаю как в нлп, но в компьютерном зрении разметка - не очень квалифицированный труд.
Смотря чего размечать. А если оценивать результаты нейронки с точки зрения кастомер-экспириенс - это тоже «не очень квалифицированный»? :)
  • 0
  • 0

6713

Это очевидная точка зрения. Если у вас есть куча качественных данных, что вы с ними сделаете без специалиста по нейронкам, если не отличаете бинарную кроссэнтропию от среднеквадратичной ошибки?
а мне и не надо, есть специалисты по сбору данных (data curation) - вот они вылавливают весь мусор. это не моя работа, и даже не инженера по нейронке :)
  • 0
  • 0

6714
Нейронки обучает специалист по нейронкам.
вот это прокомментирую: это - немного наивная точка зрения. Всё это прекрасно, пока речь не идет о личных данных, GDPR, прайваси и т.д. И тогда надувная нейронка с полки уже не подходит, потому что кто ж вам даст нужные качественные данные, чтобы на что-то такое дрессировать нейросети? ;)
  • 0
  • 0

6715
насчет естественного интеллекта, тут, мне кажется, должно быть очевидно. Нейронки хороши только настолько, насколько хороши данные, которыми их кормят. Если цель не создавать чат для бредогенерации вроде ЧатГПТ. А кто вам сможет обработать данные так, чтобы от них был толк? кто подготовит тренировочный фураж, так сказать?
  • 0
  • 0

6716
больше контекста - затруднительно по юридическим причинам :)
  • 0
  • 0

6717
У зубров своя мораль, талмудов они не читали и про Путина не знают.
нескрепные твари >:( >:( >:(
  • 0
  • 0

6718

Ну не на петабайтах же её тренируют. Обычно размер датасета - тысячи или десятки тысяч элементов. (Датасет ImageNet содержит много миллионов изображений. Это уже астрономический уровень. На практике его не используют, а берут предобученные сети, если надо.) Данные лежат в файлах, разметка - в текстовых файлах, базы данных не нужны.

А о каком уровне карьеры мы вообще говорим? О промышленном программировании имеет смысл говорить, если человек уже виртуозно обучает нейронки и в качестве вишенки на торте такой: "А я ещё немного фулстеком могу". Но если есть куда развиваться именно в машинном обучении, я бы дал противоположный совет: сосредоточиться на машинном обучении. Для него необходим и достаточен один язык: питон на базовом уровне.
я даже слабо понимаю о чем вы пишете, но точно знаю, что мимо :) Я повторяю: я лингвист, а не инженер. Программируют инженеры, моя работа - анализировать, грубо говоря фейлы и давать рекоммендации. А сеты из тысячи кейсов - это ни о чем. Такое число проходит через 1 (!) аналитика данных за пару дней, а аналитиков - сотни
  • 0
  • 0

6719
С чего вдруг в сторону gcc⁈ Всем известно, что это лучшие в мире компиляторы.
Просто не ожидал, что Apple, зацикленная на проприеритарности и исключительности и с зашкаливающими ценниками на свой продукт, ими пользуется.
вы наверное пропустили, что в 2014 году емнип Аппл перешел на открытый стандарт
  • 0
  • 0

6720
Всё, конец Европе. Р. Кадыров пишет в своём ТГ-канале:
«НАЧАЛОСЬ НАСТУПЛЕНИЕ ПОДРАЗДЕЛЕНИЙ "АХМАТ". Нам надоело ждать. Сатанисты понесут заслуженное наказание. Спросим страны Европы за каждый патрон, за каждую сожженную букву священного Корана, за каждое нечестивое слово в адрес Ислама. Весь мусульманский мир сегодня уже видит истинное нутро Запада, его неприкрытую и неоправданную ненависть к России, Исламу, традиционным семейным и человеческим ценностям.»
тиктоку приготовиться? наступление по всем фильтрам? :D
  • 0
  • 0

Pages: 1 ... 446 447 [448] 449 450 ... 1953