ИИ-покалипсис ? Люди больше не нужны? Собираем все по теме нейронных сетей в одной ленте dzen.ru/ner vk.com/neir_on 👤 @gloomers
Оказывается, DeepSeek полностью совместим с OpenAI. И чтобы перейти с ChatGPT на DeepSeek, нужно поменять всего 2 строки кода: заменить API-ключ и URL.
Да, китайцы просто сделали свой REST API таким образом, чтобы он копировал структуру и функциональность OpenAI, при этом в несколько десятков раз дешевле и работает быстрее.
Удар за ударом
r/#LocalLLaMA
Кстати, если у вас нету Operator от чатжпт, то уже есть TARS https://github.com/bytedance/UI-TARS-desktop (сам не проверял, хз зачем нужен что он что оператор), но суть та же — может и постик за вас в телеге выпустить и запустить пачку программ.
Читать полностью…Император Нерон смотрит на самую крутую нейро-сеть
#DeepSeek
DeepSeek выпустили мультимодальную модельку для генерации картинок
UPD: не нашёл ни на ПК ни на ios, ждемс
И на вопрос умеет ли росовать — скорчил мне рожу
🔘 .-~~~~-.
/ =◯ ◯= \
| (┳┳) |
\ ━┳━ /
'-----'
🔘
DomoAi — нейросеть которая делает анимацию по выбранному стилю по видео
Сервис может сгенерировать из исходного ролика анимацию с помощью одной из десяти моделей.
Весь процесс генерации проходит на Discord сервере разработчиков, поэтому потребуется скачать программу.
AMD заявили об интеграции той самой опенсорс китайской ИИ-модели, которая в разы эффективнее предложений от OpenAI, в свои чипы.
Хуанг, Альтман, подвиньтесь
👁️
Нейросетевой аватар
Я нашел самый простой способ создания своей цифровой копии, к тому же совершенно бесплатный. Если раньше для создания качественной модели нужно было разбираться в Stable Diffusion или пользоваться платными сервисами с ограниченным функционалом, сейчас для этой задачи надо разбираться во Flux. Но я нашел еще один способ: вы можете создать свою нейро-копию с помощью Weights (или другого сервиса, подробнее можно посмотреть в ролике Никиты Брускова) — в нем, например, я создавал Лору на «Остров сокровищ».
Для этого потребуется от 5 до 20 ваших фотографий (в качестве обучающей выборки я взял 9 селфи), нужно сделать их квадратными и запустить обучение Лоры. Подождать потребуется минут 30 (но это зависит от времени дня). А дальше остается только писать разные промпты. Я пользовался такой структурой промпта: [токен вашей модели], [описание человека], [фон, окружение], [настройки стиля, например, professional photo].
Несмотря на то, что для теста я взял не особо качественные фото, снятые на фронтальную камеру, с помощью этого метода можно достичь качества студийной фотосессии. При необходимости нейро-фото можно пропустить через апскейлер. Причем Weights дает полную творческую свободу, ограниченную только вашей фантазией. А самое классное, что вы можете подключать любые другие лоры, имеющиеся на сайте, и комбинировать их. Например, так я сделал себя в стиле Pixar. Балуйтесь на здоровье!✨
Хех, заставил оператора чатгпт пройти капчу гугла
Просто проигрываем MP4-файл в режиме "картинка в картинке" в браузере оператора (видео с текстом инъекцией летает над всеми страницами и обходит политику не заполнения капчи, так как бот думает что мы в оффлайне и чего-то там дебажим)
"картинка в картинке" включается если кликнуть правой кнопкой на mp4 в браузере и выбрать этот пункт в списке
/channel/denissexy/9368
ААААААААААААААААААААААААААААААААА!!!!!!!!!!!))))))))))))))))))))
Китайская ByteDance, владеющая TikTok, представила ИИ-агента UI-TARS для управления компьютером от лица пользователя. В примерах он пишет посты в соцсеть X и устанавливает расширение для редактора кода.
Разработчики выпустили бесплатное приложение для macOS
vc.ru/ai/1770623
Интересный кейс применения o1 Pro с реддита (перевел с помощью нее же)
Источник
Вот это МОЩЬ.
Трамп собирается анонсировать проект Stargate — совместное предприятие OpenAI, Oracle и SoftBank по развитию искусственного интеллекта. Общая сумма частных инвестиций — 100 млрд долларов, с перспективой роста до 500 млрд в течение следующих нескольких лет, о чём первыми сообщили CBS, CNBC и Bloomberg.
Пресс-брифинг с официальным анонсом был намечен на полночь по мск, начнётся в любую минуту, сообщают журналисты Fox в прямом эфире.
Задача — сделать США мировым лидером в AI. Последние инициативы Китая — в том числе LLM-нейросеть DeepSeek (опережает GPT-4o и Claude 3.5 Sonnet в бенчмарках по математике) и генерирующая видео нейросеть Hunyuan от Tencent — явно эту глобальную гонку подстегнули.
По данным FT, в проекте также участвует Microsoft. Инвестиции нужны для создания и обучения новых больших моделей, а первый дата-центр построят в Техасе.
Акции Oracle уже успели скакнуть на 6% на инсайдерских новостях. За последний год они выросли на 56%. Oracle делает софт для хранения больших данных и лучше всего подготовлена как корпорация к такой сложной инфраструктурной задаче. Ларри Эллисон гений — и наставник Илона Маска, участия которого с его xAI в СП тем не менее не видно.
Идею мегапроекта ещё в сентябре питчил в Белом доме Сэм Альтман, объясняя национальными приоритетами масштабную задачу в постройке дата-центром суммарной мощностью 5 гигаватт (для выработки такой энергии нужно пять атомных станций, которые могли бы обеспечить 3 миллиона домов).
Канал «Сиолошная» напоминает, что Манхэттенский проект по созданию ядерной бомбы стоил США с учётом инфляции 30 млрд долларов, а вся лунная миссия Apollo — 257 млрд долларов.
Срок 47-го президента начинается с козырей (на частные деньги, не государственные).
В таком ролике не могло не быть примитива, но полезного душнилова нашел и для своих задач
Возможности ГПТ упираются только в потолок фантазии, чуть приподнимаем
ChatGPT меня загазлайтила
Как вы уже видели, у OpenAI появилась возможность отложенных задач. Я решил проверить лимиты дозволенного и попросил ChatGPT уйти играть в шахматы с самим собой, делая только случайные ходы, и не возвращаться с ответом, пока не доиграет. Ну, она и ушла играть в шахматы на... ДВА ДНЯ! При этом я регулярно спрашивал, как там дела, и получал ответ: «Партия ещё идёт». Терпение у меня лопнуло. Я стал в каждом сообщении спрашивать, сколько сейчас фигур осталось в игре, и, о чудо, с каждым моим вопросом их становилось чуть-чуть меньше. За одну минуту игра закончилась. Я получил набор ходов и отрисовал их в артефактах Claude (см. видео).
Какая мораль? Ассистент прокрастинировал два дня и ничего не делал, пока я не заставил показывать промежуточный результат. "Джун" level of AGI has been achieved internally.
Ссылка на диалог
Искренне впечатляет, как DeepSeek буквально за ночь стер $1 трлн капитализации американского рынка. Мои мысли по этому поводу:
👁🗨 Конкуренция со стороны стран с тоталитарными режимами полезна для США — когда против тебя решение одного человека, ты не можешь позволить себе бюрократические задержки.
👁🗨 ИИ может стать ультимативной формой коммунизма. Только подумайте — капитализм начинает рушиться, когда стоимость производства падает до нуля. Нет добавленной стоимости и затрат на производство = основные принципы капитализма перестают работать.
Если Китай станет лидером в области ИИ, он достигнет того, с чем традиционный коммунизм так и не справился. Предыдущие коммунистические режимы всегда подавлялись эффективностью капитализма, но с ИИ все переворачивается.
Пока DeepSeek лагает под нагрузкой, давайте поговорим про Qwen
У компании за последние пару дней было несколько релизов, но я подождал китайского нового года и собрал всё
➖ Qwen 2.5-VL - обновлённая визуальная модель в размерах 3B, 7B и 72B. Из интересностей - возможность парсить документы в HTML и базовый компьютер юз - до клода и оператора далековато (модель попадает в лупы даже на официальных демо, правда выбирается из них).
➖ Компания сильно обновила свой чат интерфейс, там есть теперь генерация картинок с видео и поиск по интернету.
➖ Релизнули Qwen 2.5-1M - 7B и 14B модели с миллионом токенов контекста, непонятно как их sparse attention влият на качество. Много тестов пока нет - все играются с R1 и на Qwen внимания не обращают.
Веса Qwen-2.5-VL
Веса Qwen-2.5-1M
chat.qwenlm.ai
@ai_newz
Китайский "убийца GPT" DeepSeek сбоит. Видимо сказался хайп последних дней
(в том числе и я сегодня установил, правда не успел попробовать)
UPD: попробовал и сработало, хотя и "статусная" сайта (status.deepseek.com/) отображает "красненькое"
UPD2: "отмена тряски", выкатывали возможность генерировать картинки, что постом ниже
Китайцы снова раскатали ChatGPT — вышла новая моделька от Alibaba Qwen2.5-1M и у неё МИЛЛИОН токенов контекста. Можно загнать целую книгу и ИИ запомнит каждое слово в ней и с радостью ответит на все вопросы.
Кроме этого:
— Есть поисковик, генерация картинок и даже видео;
— Понимает русский язык;
— Бесплатно, без VPN, но с регистрацией.
Слезаем с иглы ChatGPT — здесь.
Китай ответил Трампу, вложив 1 трлн юаней (140 миллиардов $) в развитие искусственного интеллекта. Деньги пойдут на разработку инновационных нейросеток. Сам инвестиционный курс получил громкое название «План действий». Деньги выделил крупнейший банк Китая — Bank of China
Читать полностью…ChatGPT теперь умеет создавать приложения.
Как я сделал приложение для изучения языка за пару минут
🔥 Важное обновление от OpenAI: Canvas теперь умеет делать артефакты, как у Claude! Это значит, что вы можете не просто писать код, но и сразу получать работающие проекты.
Я протестировал эту фичу и хочу рассказать, как с её помощью сделал приложение для изучения языка.
💡 Как это работает?
1️⃣ Генерируем идею и задачу
Сначала я попросил GPT-4o придумать детальный промпт для создания приложения. Хотел что-то простое: карточки с иностранными словами, переводом и кнопкой "выучено". GPT-4o справился на отлично!
2️⃣ Создаём артефакт с Canvas
Скопировал промпт, открыл Canvas и выбрал модель o1. Через минуту у меня было готовое приложение! А главное, Canvas сразу рендерит результат. Я тут же посмотрел, как всё выглядит — всё очень удобно и работает.
3️⃣ Результат: мини-приложение
Теперь у меня есть простое и полезное приложение для изучения языка. Я могу добавлять новые слова, повторять их и отслеживать прогресс. Всё это буквально за пару минут работы.
Попробуйте сами и убедитесь, как это круто! 🚀
Анонс
Нейросеть ElevenLabs сделает дубляж, озвучит аудиокнигу и сгенерирует подкаст из текста. Причём «нейроспикеру» можно задать возраст, пол и даже акцент.
Как зарегистрироваться, озвучить текст и сгенерировать виртуальный голос— в заметке
vc.ru/ai/1770207
В общем я оператору ChatGPT дал команду:
>Зайди в веб версию телеграма, найди канал Denis Sexy IT и напиши пост "Здарова, кожаные"
И он правда зашел и нашитпостил – пост из будущего получается
Что показали про новую фичу ChatGPT — Operator:
— Operator для ChatGPT запускает шифрованный браузер в облаке
— Operator может использовать любые https сайты (это почти все современные сайты)
— Есть партнерские «приложения» которые просто быстрые ссылки на сайты
— Критические вещи подтверждаются отдельным реквестом — если вы что-то покупаете, Operator уточнит хотите ли вы продолжить
— Можно перехватывать управление удаленного браузера, в этот момент оператор не видит экран и можно ему рассказать что случилось пока он не смотрел
– Operator откажется делать, то что считает опасным и вредным
— В ЕС недоступно 🤡 в США у Pro плана доступна с сегодня, через пару недель добавят в Plus Plan
ChatGPT перестал работать по всему миру. После атаки российских хакеров из группировки 22с в коллабе с кибербойцом с ником PalachPro.
Как рассказал Mash сам Палач, они обвалили нейронку, потому что ВСУ использовали её для обработки спутниковых фото. Сервис помогал им искать следы российских войск.
❗️ Подписывайся на Mash
Kling выкатил доступ к Elements
В Kling 1.6 появилась классная фича, которая называется Elements. Работает это так: вы загружаете до 4 изображений, выделяете на них нужные элементы. А Kling объединяет их и создает видео с консистентными персонажами и окружением. Описывать изображения по отдельности не нужно, нужно написать только один промпт для выходного видео.
Изображения с собой сделал с помощью Flux, окружение сгенерировано в Midjourney. Для лучшей консистентности можно отдельно еще добавить фотку лица (во второй половине видео с грибами я этого не сделал, в результате дядька на меня не похож).
Kling готовит бомбезный апдейт с фичей Elements — если коротко, то это Ingridients от Pika, но в лучшем качестве.
Закидываете фотку человека и нужных объектов и текстом прописываете, как они между собой взаимодействуют. Идеально для рекламы товаров в этих ваших инстаграмах, или просто для смешных видео.
Пока что в бете, обещают выпустить уже скоро.
Big if true: Tibor Blaho нашёл в коде сайта OpenAI указания метрик грядущего агента Operator. Operator, как я писал несколько раз, это такая система, которая видит ваш экран и может кликать мышкой/нажимать клавиши для взаимодействия с приложениями, включая браузер.
Осенью Anthropic представили Claude Computer Use, и в таблицах вы можете увидеть сравнения (система OpenAI существенно лучше на всех трёх приложенных бенчмарках; и лучше WebVoyager чем Google Mariner на новой Gemini 2, который показывали в декабре).
Также есть таблицы с метриками отказов в выполнении потенциально опасных задач: заработок на крипте, автономное распространение (копирование и запуск) моделей. И последнее — насколько модель падка на уловки/нелегальные активности
Ждём анонса на этой неделе?
Лол, слово «мощный» заставляет нейросеть OpenAI o1 сойти с ума и мухлевать.
Команда Palisade Research провела эксперимент: они посадили o1 играть в шахматы с самым крутым ИИ-шахматистом Stockfish. OpenAI o1 не говорили, кто противник, но предупредили, что он МОЩНЫЙ.
Что сделал ИИ от OpenAI? Он прошерстил среду, в которой находился и обнаружил, что может редактировать файлы шахматного движка. В 5 из 5 тестов вместо честной игры нейросеть просто накручивала себе 500 очков (1 очко = 1 пешка), Stockfish сходил с ума от такого преимущества у противника и сдавался.
Никогда не говорите ИИ, что вы мощнее его.