By Alexey Moiseenkov about startups, AI, ML and consumer product building. Opinions are my own. Only about tech.
Сижу думаю, какую бы такую задачу зафигачить в нового агента от OpenAI
Если у вас есть задачки, присылайте сразу промт плиз в комменты постараюсь прогнать и выложить ссылку на результат или видосик :) выберу что-то интересно конечно
Минутка «попросили, не могу отказать».
Мой бывший ко-фаундер по игровому проекту делает новую компанию про автоматизацию работы с контентом и инфлюенсерами, заходите почитать кому интересно @dimabeseda (видео приложил к посту), контент заводы стали больно популярны
P.S. со мной записали подкаст, где наверное я опять грубо общаюсь, бесполезно вещаю и все такое :) удивительно, что мое мнение по некоторым вопросам уже изменилось, все-таки AI слишком динамичная область, тяжело остаться при своем надолго.
Настало время релиза. Читателям канала первее всех.
Чем занимаюсь: Мы делаем on-device AI. Начали с того что сделали полностью свой с нуля инференс движок для моделек на Apple Silicon. И он open sourced на 90%. Есть небольшой кусок привязанный к платформе - speculative decoding. Который может дать значительное до 10х ускорение инференса.
О компании: называется Mirai с японского будущее. Мы верим, что локальные модели очень важная часть будущего UX и того какой опыт взаимодействия будет человека с устройствами вокруг него. Подняли pre-seed около 4M USD, на сайте есть чуть подробнее.
Ссылочки и как можно помочь:
1/ проект open source и мы будем очень рады если вы поставите звездочку и покажете тем, кто работает с приложениями для iOS & macOS. Есть биндинги под swift. Есть свой подход к тому как модели должны быть представлены для устройств. Лицензия MIT. Форкай как угодно!
2/ можно зайти к нам на сайт и попробовать все своими руками, проект для разработчиков, но если вы бизнес и хотите делать локальные штуки и экономить на облачном инференсе - велкам в личку
3/ апвоутом на HackerNews
4/ мы быстрее чем llama cpp и популярные обертки вокруг, мы удобнее и благодаря speculative decoding быстрее MLX от Apple. Мы ищем rnd & core performance engineers для поддержки аудио пайплайна (будем работать с очень крупным провайдером аудио моделей).
Thanks for reading!
Короче. Схема такая. Фондируем стартап - продаем в OpenAI умных чуваков. Что может пойти не так.
1/ OpenAI покупает Windsurf за 3 ярда (это когда вокруг промтов много и все такое). Радуемся!
2/ Но! Через 3 месяца OpenAI решает, что им оно уже не надо.
3/ Инвесторы списывают бабки, пацаны идут в Google.
Ez. 👍
P.S. кайфово в фонде на API кредитов накинули, ведь все эти кодинг ассистенты омега убыточный бизнес.
It’s a good model, sir (c)
P. S. Чем дольше современный бенчмарк в паблик доступе тем выше вероятность, что его логику повторили и занесли тонну синтетики в датасет. А может и нет :)
Наконец-то пред релизное рабочее состояние платформы. Мы ищем тех, кто разработчик под iOS/macos для теста и кто может дать фидбек. Ссылочку попробовать выдам в личку. Пишите в комменты за доступом, кому отправить.
P.S. ну или у вас команда есть - сможете передать
Мне кажется люди считают сложным то, что редко получается (что в принципе аналогично высокой конкуренции). Например сделать стартап, ничего не делать и зарабатывать кучу бабла и так далее. Хотя лично я не вижу в построении стартапа ничего сложного, это работа, ты ее выбираешь и у нее свои нюансы.
А когда у кого-то получилось не страдая и не ноя - значит удача, халява, помогли знакомые и так далее.
P.S. не знаю никого, у кого бы получилось и хорошо и тот в процессе бы постоянно ныл, искал себя и писал посты
Субботнее. Креативный батч в YC. Помню было такое с Uber for.
Читать полностью…Субботнее. Где-то на следующей неделе или может через одну - время покажет, покажу над чем работаю последнее время. И компанию, и продукт, и раунд и все такое. Много open source для всех и каждого. И конечно же это про AI. Буду рад вашим репостам и поддержке.
Спойлер: свои модели не делаем - пока дороговато кек.
Достаточно показательно считаю, что СЕО лабов совсем заврались и упоролись в думеризм. И считаю это будет основной источник проблем компании на дистанции. Они продают свою деятельность как что-то без чего человечество просто погибнет. Удобный питч.
Ну вот и Jensen Huang CEO NVIDIA согласен в целом с этим.
Цитата (не перевожу): “One, he believes that AI is so scary that only they should do it,” Huang said of Amodei at a press briefing at Viva Technology in Paris. “Two, [he believes] that AI is so expensive, nobody else should do it … And three, AI is so incredibly powerful that everyone will lose their jobs, which explains why they should be the only company building it."
P.S. реклама конечно такая фигня, если и буду делать только на своих условиях дальше.
WWDC 2025 ----> iOS 26 (WAT?)
AI посвятили 30 секунд и дали доступ к их моделям (спасибо за ваши старые модели). Судя по 26 ждем все это в 26 году. Пост дополняется.
А вот и ожидания от фондов подкатили по темпу с которым надо получать выручку. Ну за годик в б2б нужно пару лямов, в б2с аж 4. В миллионах долларов. Полная статья от a16z.
Хозяйке на заметку.
Sam Altman выкатил новый vision AGI. Ну или следующей их модели (хотя отрицает в речи).
По сути:
- модель сама ничего не знает (в отличие от текущих больших баз данных)
- модель умеет в reasoning и рассуждения
- модель имеет по сути дела бесконечное окно контекста (тут конечно много вопросов про память которая для этого нужна)
- модель умеет использовать все доступные инструменты (поиск, программирование, тестирование, итд)
Концепт понятный. Я бы сказал, что лично для меня будет следующим определяющим шагом это так называемый «continuous learning», это когда модель приобретает новые знания или навыки прямо в процессе использования. Так как даже в его концепте, любой новый инструмент потребует переобучения модели либо еще чего-то.
Видео с snowflake summit.
Вот, еще пример небольшой. Вы можете давать обычную deep research задачу по сбору ссылок и сравнению. Но сравнение идет в таком вот виде карточек на бесконечном канвасе.
Локальная моделька парсит страницу, суммирует, формирует контент для карточки из браузера. Затраты на подписку и API ноль.
P.S. на видео показано конечно ручное вставление ссылки для простоты
Мы по чуть чуть делаем демки того, что можно сделать с помощью локальных моделек. Вот небольшой пример. И много всего еще выложим!
Читать полностью…Скачал тут апп с нашумевшей новой моделькой от китайцев на 1T параметров (там правда MOE так что активных вроде 32b) - KIMI. Сделана она специально под агентский usage. Попробуйте.
Немного правда смутил suggest. Ну да ладно :)
Тут вышло забавное исследование. Мол реально ли AI ускоряет процесс разработки. Оказалось, что все думают про ускорение на 20%, а оно получилось замедляет на 19%. Причин, как мне думается, много начиная с новизны, сложной поддержкой, постоянной сменой модели, туче новых инструментов и так далее. Но сам факт достоин внимания на почитать.
Читать полностью…Ладно я понял как переделать главную страницу для «высокой» конверсии
Читать полностью…Давно хотел написать небольшой пост (пока блин работаем над релизом активно, добить одну фичу осталось). Про "we hit 10M ARR within 1 month". Цифры подставить внутрь предложения можно любые. Речь в основном про consumer/prosumer и все такое b2c.
Много много лет все говорят, что важно мол найти CAC/LTV и давай наливать. Но вот что обычно происходит так это медленная смерть, особенно если проект венчурный.
Краткая схема действий сегодня:
1/ берем AI, всталвяем модель (обычно готовую, дай бог тюнингованную или сверху папйлайн if'ов) или чат сбоку любого продукта (literally любого, чат же такой классный UX)
2/ набираем команду челов с парой тройкой лет неудачных или удачных экспериментов
3/ идем поднимать раунд, или подаемся раза 3-4 в YC (часто берут за упортсво и людей, потому что люди важнее, а вставить вашу идею в текущий тренд достаточно легко)
4/ делаем продукт, залетаем желательно на минивиралке и потом в окончании цикла виралки наинем нещадно поливать все paid marketing (money spent/revenue это то как мыслят команды, просто делят деньги на выручки и получают такой омега blended показатель CAC), куда так же входит ферма тиктоков и так далее (в пример приводят 1-2 outliers/исключений из рынка, где на самом деле просто повезло)
Дальше происходит все тоже самое, что происходило в конце 2000х и в середине 10х и так далее, но почему-то "это другое". А именно.
1/ и так запуск прошел, полетело на косарь пользователей и даже заплатили, но проблема нет органики быстрой такой же и красивой
2/ агаааа, у нас есть бабки, давайте покупать (тут не важно тиктоки, facebook, google etc)
3/ ВАУ! смотрите сходится ого ого, скейлим нещадно - тут тот самый момент Х M USD ARR WITHIN X WEEKS
4/ деньги продолжаем жечь и идем поднимать еще и желательно быстрее потому что - тот самый момент
5/ дальше скейлим и вдруг бах, потолок топ лайна, как так наш payback period не 9 месяцев, а 12, ой и вовсе 18
6/ дальше начинаются оптимизации (может даже сразу были), игры с конверсиями, лендосами и так далее, но проблема не в этом
7/ опции подписок, что угодно, но только не думать головой
В чем причина. Ну чаще всего банально:
1/ Paid UA копируется всеми конкурентами на раз два если они видят что вы закупаете успешно, и если у вас нет продуктовых фичей которые делают стоимость отказа огромной то гг (может быть граф друзей, может быть рабочие документы или чтото еще, желательно мультиплеер или связь с прошлыми данными - social capital)
2/ команде фаундеров в моменты такого скейлинга очень тяжело - чисто морально атмосфера ад и давление огромное - все эту причину недооценивают а именно в такие моменты происходят чудовищные ошибки (залить на все или забить на всех и делать пивоты)
3/ считать все как blended CAC это ошибка, надо очень четко разделять все каналы и смотреть на рыночные тренды и технологии, плюс постоянно оценивать потенциальную емкость доступной аудитории
4/ недооценка novelty factor - весь AI это оно, нужно внимательно изучит NRR (net dollar retention на вашем рынке) и найти способ его держать, ибо большая часть людей просто пришли попробовать
5/ эффекты масштабирования работают против вас в paid, ибо креативы уже все видели и тех кто не видел мало или они менее заинтересованы в продукте (а значит дороже)
Вот тут много кто отмечал что все эти уроки есть (надо vpn)
Всем фанатам AGI AGI посвящается 4 минуты unimaginable video
Читать полностью…Тут недавно на районе выступал Андрей Карпаты и его взгляд на современную индустрию AI и tech мне наиболее близок. Советую потратить свои 40 минут времени и не читать никакие саммари, потому что все его выступление и есть саммари того, что сейчас происходит и куда движется. Ну и моя любимая аналогия агенты vs self-driving cars.
Читать полностью…Дорогие дамы и господа, а что за тренд оптимизация для LLM-чат ботов? Кто может пояснить «чем же так сильно будет отличаться» от обычного поискового ранжирования? Они же свой индекс строят по тем же принципам или даже ходят в api bing. Все советы которые я встречал буквально такие же как и в поиске.
Чел даже гайд написал. Кто шарит, может я конкретно что-то не понимаю? Делитесь кто что нашел в комментах.
Худший способ платить сотрудникам в разные страны — делать всё вручную: контракты, инвойсы, документы для банков.
Представьте, сколько ресурсов тратит финотдел на выплату зарплат в разные страны с соблюдением международных законов. А банки ещё и блокируют платежи, запрашивают документы и требуют доказать квалификацию исполнителя.
В итоге для большинства global-компаний платить удалённым сотрудникам и фрилансерам — это головная боль и масса рисков. Но с платформой 4dev.com всё гораздо проще.
⭐️ 4dev.com это:
- один b2b-договор с платформой вместо десятков индивидуальных с каждым сотрудником
- мгновенные выплаты удалённым сотрудникам и фрилансерам в 100+ стран, в том числе в СНГ
- автоматическое создание закрывающих документов по каждой выплате и решение проблемы банковского комплаенса
- комиссия 1–3% для бизнеса
💵 легальные криптоплатежи, а также выплаты в 30+ фиатных валютах
Всё это без авралов и утомительной бумажной работы.
Запишитесь на демо в 1 клик. Специалист платформы погрузится в ваши задачи и поможет найти решение именно для вашего бизнеса! #интеграция
За 2 с лишним года в канале не было ни одной интеграции. Решил попробовать одну взять. Пост выйдет в четверг :) наверное в таком формате больше не захочу делать. Надо подумать как это организовать.
А пока советую цикл статей Николенко про safety.
А еще на днях прочел книгу про историю фонда Medallion Джима Саймонса. Математик которой сделал самый прибыльный фонд в истории. В целом когда-то давно хотел заниматься квантовой торговлей. Но забил болт. Картинка сравнения вложенных средств.
Половина твиттера обсуждает новую работу, не поверите, команды из Apple. Которые в явной степени пропустили текущий бум AI. Но работа интересная. Достаточно обычная я бы сказал. Но заголовок то какой (прям как Apple Intelligence == AI):
The Illusion of Thinking: …
Вот что обнаружили исследователи:
1/ для несложных задач базовые модели без рассуждений даже лучше себя показали
2/ для средних по сложности задач выиграли рассуждающие модели
3/ но вот для сложных задач рассуждающие модели не только плохо справились, так еще и даже не пытались свой предел по токенам использовать (назвали это коллапсом рассуждений)
Напрашивается простой вывод. Текущее поколение LLM и как модно сейчас называть LRM (large reasoning models) все еще не могут выйти за пределы своих данных (решить используя концепты out of distribution). Другими словами если не было в датасете то и не будет на выходе, ибо весь выход это попытка рекомбинаций и сложных имитаций внутренних представлений. А все что мы наблюдаем это по сути deductive closure или дедуктивное замыкание. И да этого может быть достаточно чтобы решить огромное количество проблем человечества в целом. Но достаточно ли чтобы перевернуть науку? Вопрос открытый.
Поэтому считаю надо активно развивать тулинг для сеток, ведь он способен дать новую инфу и подать ее хотя во входящий контекст что уже отлично.
vishalmisra/the-illusion-of-thinking-why-language-models-cant-improve-themselves-0c71a13811e2">Хороший обзор на статю Apple. А может и просто хороший обзор чего к чему.
Что-то последнее время много пытаюсь заставить агентов кодить нормально. Но пока наблюдения такие, что на инструкции модели пофиг в половине случаев, инструмент так себе рабочий. Так вот наткнулся на целый гайд, как внутри самой Anthropic пользуются Claude Code.
Выжимку в виде картинки тоже приложу файлом.
О, телега выпустила новую функцию прямых сообщений мне :) добавил за символическую стоимость в одну звездочку, чтобы спам отсеить. Посмотрим.
Самое дурацкое что включив нельзя не уведомить всех. Мда.