life = curiosity + irreducible noise Whois: https://t.me/boris_again/1652 Лс: @btseytlin
Дал комментарий в СМИ
https://achbd.media/a/ai-for-support
Есть тут те, кто ищут работу? И как оно?
Чтобы вам было немного полегче, редакция «Техновзгляда» собрала парочку самурайских приемов. Ими поделился Boris Again. Сейчас он работает ML-специалистом в Португалии.
Хотите так же? Полистайте картинки, а потом почитайте методичку Бориса. Там все разложено по полочкам:
Методичка: Поиск Работы в ML/DS
Стартовал SemEval-2024 про детектирование AI-generated текстов
Десять задач, даже про мемы есть:
Task 1: Semantic Textual Relatedness for African and Asian Languages
Task 2: Safe Biomedical Natural Language Inference for Clinical Trials
Task 3: The Competition of Multimodal Emotion Cause Analysis in Conversations
Task 4: Multilingual Detection of Persuasion Techniques in Memes
Task 5: Argument Reasoning in Civil Procedure
Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes
Task 7: NumEval: Numeral-Aware Language Understanding and Generation
Task 8: Multidomain, Multimodal and Multilingual Machine-Generated Text Detection
Task 9: BRAINTEASER: A Novel Task Defying Common Sense
Task 10: Emotion Discovery and Reasoning its Flip in Conversation
Для меня наиболее интересна восьмая: детектирование AI-generated текста.
Дедлайн подачи решений: 31 января 2024
Я стараюсь послеживать за тем, что делает Яндекс. Ранее писал про хорошие доклады от них и надеюсь скоро напишу про доклады с Highload. Сейчас про YaC. Интересный формат пиара в виде сериала.
YaC 2023 – небольшой сериал, где команда компании рассказывает про технологии и сервисы. Честно говоря посмотрел только серию про нейросети.
Рассказывают про LLM с самых основ, Алису и, конечно, YandexGPT.
Интересные для меня моменты:
* Объяснения обучения (и проблем обучения) LLM очень простым языком
* Описали несколько кейсов применения. Например, сбор и саммаризацию отзывов на Маркете, перечисление основных преимуществ/недостатков товара или услуги. К сожалению не говорят про продуктовый импект.
* Наняли 300 AI-тренеров с междисциплинарными скиллами для дообучения нейросеток. Интересно, что это не краудсорсинг, а инхаус команда. Выглядит как ренессанс для ассесоров.
Посмотреть серию можно на ютубе или кинопоиске.
Еще кстати на самой конференции засветился Филипп с темой про ИИ в образовании: /channel/ppilif_chanel/466
https://blog.samaltman.com/how-to-be-successful
Читать полностью…Unfun fact of the day: нельзя зафитить простую регрессию к вертикальной линии
Значит если у тебя есть сегментационная маска в виде вертикальной линии ты не можешь просто зафитить кривую к ней :(
#личное
Есть ряд максим, согласно которым я стараюсь жить.
Главная из них: не будет голоса с неба, который принесет внезапное избавление. Иначе говоря, ответственность всегда на тебе.
Раньше я приводил весь список: /channel/boris_again/1264
Сегодня я добавил к нему новую, из книги "12 rules for life" Питерсона:
I will act in a manner that leads to the alleviation of unnecessary pain and suffering
- The deed is done, Master
- Very well, my apprentice
Илья Сутскевер отчитывается Элиезеру Юдковскому о совершенном перевороте, фото в цвете
Тем временем Planet Farms теперь половина единорога (надеюсь передняя)
Читать полностью…Публикуя методичку здесь, в singularis.ai и других местах я был готов к негативной реакции. Ожидал, что много кто подумает: "да кто ты такой, чтобы меня учить?"
Но её не последовало! Вместо этого несколько человек написали мне в личку здесь и в linkedin слова благодарности, а один добрый человек даже сделал на гитхабе PR с кучей правок по части орфографии и пунктуации.
В целом очень положительный отклик, спасибо
#работа
# Методичка по поиску работы в ML/DS и IT в целом
В канале накопилось немало материала про поиск работы. Я собрал, дополнил и превратил всё в небольшую книжку.
Все кратко и по делу. Чтения минут на 30. Внутри рассматриваю поиск работы с самых азов и до деталей с примерами из жизни.
https://btseytlin.github.io/intro.html
Если вы давно читаете этот канал и хотели бы ему помочь, то вот лучший способ: скиньте методичку кому-то из друзей.
@boris_again
#работа
# Оптимизация резюме под вакансию
Ранее я писал, что во время поиска работы наиболее важно экономить энергию и приоритизировать усилия. Одна из стратегий это подаваться как можно больше за как можно меньшее время. Это хорошо работает, когда рынок вам благоволит, то есть предложений сильно больше, чем кандидатов. Однако сейчас рынок совсем не такой.
Есть и другая стратегия: тщательные отклики. Если вы располагаете достаточным количеством времени и энергии, то можете готовить уникальный отклик для каждой вакансии. Это позволит получить максимальную конверсию на первом, самом жестоком, этапе поиска: на этапе отсева по резюме. Такой путь подходит тем, кто ищет работу фултайм.
Есть и третий путь: быстро откликаться на 80% вакансий и тщательно откликаться на 20% самых привлекательных позиций.
## Оптимизируем резюме
Итак, вы решили сделать тщательный отклик. Его задача: пройти через два фильтра. ATS и оценка рекрутера.
Больше всего проблем доставляет ATS. ATS (applicant tracking system) это автоматическая система, которая оценивает релевантность резюме к вакансии.
Как правило ATS осуществляет первичную фильтрацию кандидатов, и только потом рекрутеры начинают работать с резюме. Очевидно, что чем больше совпадение опыта, навыков и ключевых слов в резюме с требованиями вакансии, тем выше шанс пройти через ATS. Однако это не всё: ваше резюме должно быть структурировано так, чтобы ATS могла его прочитать. Поэтому я советую использовать стандартные шаблоны резюме с версткой Latex.
Как сделать тщательный отклик:
1. Прочитайте вакансию и выделите ключевые слова.
2. Создайте копию своего резюме и адаптируйте её под вакансию:
* Включите больше навыков из числа упомянутых в вакансии и уберите нерелевантные. При этом ни в коем случаче не врите. Если вы не работали с какой-то технологией вообще, то не включайте её в резюме. Но, если вы хоть немного знакомы с ней, обязательно это укажите.
* Добавьте в резюме свободное описание вас как специалиста, которое перекликается с описанием вакансии.
* Переформулируйте свои достижения в разделе "опыт работы" так, чтобы они были более релевантны вакансии.
3. Напишите cover letter, который соотносится с описанием вакансии.
Как поставить процесс на поток:
1. Создайте шаблоны резюме и cover letter для быстрого заполнения.
2. Используйте один из сервисов, которые позволяют оценить релевантность резюме к вакансии. Например, https://www.jobscan.co. По сути это доступный вам ATS. В том числе он проверяет, что ваше резюме хорошо читается машинами.
3. Создавая копии резюме под вакансию обязательно сохраняйте их и подписывайте к какой компании они относятся. При достаточном количестве откликов очень легко запутаться.
В итоге процесс одного уникального отклика можно свести к 15 - 30 минутам, если достаточно попрактиковаться.
Детали такого трюка я почерпнул у ребят, которых сейчас консультирую по поиску работы.
Андрей Карпаты (один из ключевых людей в OpenAI) недавно записал часовую лекцию про то, как работают LLM (большие языковые модели типа GPT-4), какие у них ограничения и какие перспективы.
В этом видео настолько хорошо все объясняется, что если раньше ChatGPT казался мне магией, то теперь мне кажется, что я примерно понял, как он работает и какие у него ограничения. За три дня видео посмотрели уже 500 тысяч раз, поэтому я решил упороться и сделать его выжимку на русском языке на VC.
Потратил несколько часов, поэтому большая просьба: поставьте, пожалуйста, сердечко на VC, чтобы статью увидело больше людей!
https://vc.ru/chatgpt/931112-vvedenie-v-llm-dlya-teh-kto-vse-propustil-vyzhimka-video-andreya-karpaty-so-osnovatelya-openai
PS. Также можете писать здесь в комменты, если найдете какие-то опечатки или косяки
Умер Чарли Мангер, напарник Баффетта 😢
В память о нем выложу здесь его знаменитый Альманах Бедного Чарли.
Не люблю пиратить, но:
- купить эту книгу трудно,
- Чарли уже все равно, а на остальных правообладателей пофиг,
- Это крутейшая вещь про инвестиции и здравое мышление.
Rest in Peace, Charlie.
Короче теория: PhD это пирамида. Все PhD говорят, что PhD нужен. И нанимают к себе других PhD. Таким образом PhD нужен затем, чтобы стать частью PhD сообщества, которое существует, чтобы делать больше PhD
Читать полностью…Канал Техновзгляд разобрал небольшую часть моей методички на удобные для нас (зумеров) карточки
Читать полностью…Metaculus это рынок предсказаний (со звездочкой, см комментарии), где люди делают ставки виртуальных монет на вероятности событий в мире. Практика показывает, что агрегация таких прогнозов очень точна и гораздо результативнее индивидуальных экспертов благодаря правильным экономическим стимулам. Я буквально использую рынки предсказаний для принятия решений в жизни. Например, текущий прогноз по Украинскому конфликту это перемирие в 2025 году, так что я не строю больших надежд на улучшение в ближайшем году.
Они добавили новую киллер фичу: саммаризация комментариев с помощью GPT-4. Дело в том, что хорошим тоном в сообществе metaculus является постить комментарии со своими предсказаниями и причинами. Платформа добавила выжимку по комментариям предсказывающим высокие и низкие вероятности. Получаем очень крутую и объективную саммаризацию новостей.
Пример на скринах
https://www.metaculus.com/questions/19308/hamas-loses-de-facto-control-of-gaza-by-2024/
Молния от @seeallochnaya
Подробности в комментариях
# Война, лучшее время человечества, ИИ
В нашем мире порядок это очень маловероятный выброс. Например, каковы шансы, что вещи в вашей комнате сами по себе окажутся аккуратно разложены по полочкам? Беспорядок возникает случайно, сам по себе и без чужой помощи. Порядок же никогда не появляется просто так. Можно было бы привести много физических аналогий и поговорить про энтропию, но я недостаточно умный.
Когда началась война я наблюдал у многих такую реакцию, будто произошло что-то выходящее за пределы разумного. Звучали даже фразы: "война и в наше время?" или "война в Европе?" Однако лично я не был ни капли удивлен. Я был шокирован, что это происходит со мной, но в происходящем как явлении я не видел ничего необычного. Ведь история однозначно говорит нам: война это норма, а в Европе вообще любимое времяпрепровождение. Увидительно не наличие войны, а как нам повезло так долго её не видеть.
Война это норма, мир это удивительное отклонение. Можно посмотреть на другие примеры. Насилие это норма, кооперация это отклонение. Оппрессия это норма, свобода это отклонение. Деспотия это норма, демократия это отклонение. Выделяются некоторые закономерности нашего мира.
Моему поколению повезло прожить молодость во времена исключительного выброса. Может создаться ощущение, будто человечество наконец нашло естественное состояние мира, а возврат к 24/7 free-for-all кровавому рубилову был бы необычным сдвигом. Но всё наоборот. Цивилизованное общество это выступ размером со спичечную головку, на котором мы все дружно стоим, а вокруг пропасть из множества более вероятных и гораздо более неприятных состояний общества.
Поэтому господа технооптимисты с одной стороны пишут либертарианские манифесты, а с другой складируют оружие и бензин в своих бункерах в Big Sur. Вдумайтесь: ребята, которые спасают мир (без упрека и иронии, искренне делают его лучше), цинично готовятся убивать людей в случае глобальной катастрофы. Кажется они понимают, как работает мир.
Всё это практически труизмы, но можно попробовать сделать на их основе предсказания.
Про то, что нас ждет. Один факт из реального мира: регрессия к среднему неотвратима и безжалостна к аномалиям.
А мы как раз в аномальном периоде. Можно представить, что есть некий мешок со сценариями развития мира, из которого мы достаем будущее. Так вот распределение там такое, что за всю историю человечества мы всего несколько раз вытянули что-то хорошее: Древняя Греция, Рим, Просвещение, семидесятые-двухтысячные. Можно быть уверенными: если вещи будут пущены на самотек, то они не продолжат улучшаться по инерции, а наоборот, будут стремиться в типичным состояниям. Можно ткинуть в случайный год новейшей истории и это будет неплохим предиктором того, что нас ждет.
Я достаточно серьезно уверен, что мы живем в лучшее время человечества.
Очевидно наши времена лучше чем все прошлые. Но я не об этом: с большой вероятностью они лучше, чем все, что будет дальше. Мы в уникальной точке, когда технологии последней НТР резко улучшили нашу жизнь, но ещё не успели её ухудшить. Например, мы уже получили GPS, но пока не получили космическое оружие. Уже есть редактирование генома, но нет биологического оружия на его основе. Есть массовая коммуникация, но нет массовой слежки. А нет, плохой пример, скорее есть, чем нет. Уже есть продвинутая автоматизация с помощью ML, но нет цифрового авторитаризма. Черт, тоже есть. Даже есть ИИ, но ещё нет никаких значимых негативных последствий его применения.
Мы всё ещё в хороших временах. Но звоночки уже есть. Индексы демократичности стагнируют, скорость роста экономики стагнирует, скорость роста населения в развитых странах стагнирует.
Продолжение (и немного больше оптимизма) в комментариях
Не прошло и полугода, как я выложила на Хабр компиляцию своих pdf-ок "Путь к познанию мистерий обучения машин без траты денежных ресурсов" в формате статьи-гайда:
https://habr.com/ru/articles/774844/
(с чуть менее экстравагантным названием).
Пожалуйста, оставляйте отзывы и комментарии о том, что нравится/не нравится под статьей.
Старые pdf-ки, на которых основан гайд, можно посмотреть здесь: /channel/tech_priestess/588 , /channel/tech_priestess/700 , /channel/tech_priestess/838 .
P.S. Буду благодарна, если подкинете немного кармы, поскольку с момента последнего посещения Хабра мне кто-то её слил (происки УИИ? 😅).
https://bayesianinvestor.com/blog/index.php/2023/11/16/when-will-ais-develop-long-term-planning/
Читать полностью…Кстати про карьеру. У меня был пост на схожую тему: про deliverables
/channel/boris_again/1941
В сеть утекли шокирующие подробности произошедших в OpenAI перестановок
Читать полностью…Кстати, если вы недавно подписались на мой канал, вам может быть интересен мой лонгрид про интуитивное понимание Нормального распределения
https://borisagain.substack.com/p/understanding-the-normal-distribution
Немного продолжим день карьеры 🙂
Попалось под руку видео Don't Do Invisible Work
Если вы работаете в сколь-нибудь адекватной компании, пусть даже не технической, то в ней существуют процессы оценки вашей работы.
В техе это: регулярные перформанс ревью, промоушены и бонусы. К сожалению, они основаны на том, что другие люди помнят о вас и о вашей работе. И если о работе никто не помнит — то и оценивать по ней никто не будет. А как легко догадаться, люди в целом плохи в запоминании разных вещей, особенно если это руководитель с десятком обязанностей и столькими же подчинёнными.
Решени очень простое: записывать, что вы сделали, какой результат это принесло, и рассказывать об этом другим. Причём очевидно, что за вас это никто не сделает — ну разве что в очень редких ситуациях босс, если вы любимчик.
Мне вот не повезло — этот урок я получил от Валеры @cryptovalerii, когда пришёл в Яндекс. После первого месяца он спросил меня, что я сделал (а я не очень складно то и рассказал). Сказал, нужно записывать, и что через 4 месяца будет ревью, и он спросит ещё раз. В назначенный срок я получил запрос, и вот представьте насколько другой была бы выходная бумага, если б я пытался что-то впопыхах вспомнить по памяти!
-----
Стоит думать об этом в таком ключе: если в любой момент времени вашего руководителя спрашивают "а что сделал X?", то у него есть несколько примеров (не один), как он может ответить конкретикой. Понятно, что если все такие умные будут, то начнётся борьба за внимание, но это, обычно, не светит до уровня С-1/C-2.