Раз-раз
*стучит по микрофону*
Праздники почти закончились, а значит пора вернуться ко всякому, что произошло за время праздников.
Во первых хочется рассказать про любопытный документ на arxiv (http://bit.ly/2j3XWFa) – в документе идет речь о перенесении макияжа с фотографии на лицо которое вы дадите алгоритму.
То есть вы находите модель покрашенную в "смоки айз", даете алгоритму свою фотографию – а алгоритм определяет какие элементы лица нужно "выдрать" из исходной фотографии, как их растянуть и наложить на фото, чтобы получилось натурально.
Получается совсем не плохо, но все также нужен большой датасет с фотографиями стилей.
Это очень перспективное направление – ряд косметических брендов уже пыталось сделать что-то в этом направлении (Oriflame Makeup Wizard / http://apple.co/2iHthkD – iOS
и т.п.), но там все ограничивается уже заданным набором макияжа – это же позволит выбрать из фотопотока любое фото и вперед.
Ниже будет пару фотографий с результатами работы.
Во вторых, всех с прошедшими праздниками – с большим трудом я вспоминаю как это – печатать. Буду дальше разбирать RSS каналы 🤓
Хоть я сейчас и в Грузии, и вместо интересных алгоритмов и ссылок я ищу интересное вино, и даже не онлайн, и даже с утра 🙈, но какие-то ссылки всё-таки попадаются: http://www.aimakes.com/
Это сайт где выкладывают искусство созданное роботом – а главное это может быть видео / аудио / помимо нейро-арта. Еще раз можно себя спросить – что такое искусство, ответ мне кажется у каждого свой и отличная почва для холивара.
А вообще с наступающим всех, мандаринов, подарков, вот этого всего всем, спасибо вам что читаете, что я тут пишу 🎄💖🤖
Если вам вдруг интересно, что "большой брат" знает о вашем IP и торрентах, то вот, у меня есть ссылка – там записано кто, что и с какого IP скачал. Крипота.
https://iknowwhatyoudownload.com/ru/peer/
Новость мельком – полиция Дубая внедряет свое ПО по предотвращению преступлений основанное на машинном обучении. Некому алгоритму скармливают информацию по признакам совершенных преступлений, их частоту, гео-данные, ну и это, ждут.
Насколько это сработает – пока мало кто знает, но как минимум существует 3 системы в США которые используют уже годы: Predpol, HunchLab и Series Finder – но результат работы которых пока не очень ясен, так как сложно оценить насколько система реально влияет на ситуацию. В этом году так было с HunchLab, St Louis County Police ожидает падение уровня преступности за последние 12 месяцев – но что на это повлияло, они не уверены.
Но тем не менее – полиция Дубая утверждает, что такая система сильно поможет. Посмотрим через год, что уж.
http://newatlas.com/dubai-police-crime-prediction-software/47092/
Мне кажется, через какое-то время мы не сможем отличать фейки: на гифке демонстрация GAN алгоритма на знаменитостях с помощью твиттер-бота http://bit.ly/2ie6Wei
То есть улыбки сделаны автоматически
Кроме того, очень рекомендую сам канал «Мастриды» много хороших статей каждую неделю.
Читать полностью…"У нас было 6000 доменов, 250267 разных урлов, 570000 ботов, российские паспорта, крутое имя "AFK13" и от 3 до 5 миллионов долларов в сутки". Так бы сказал кто-то из команды Ad Fraud Komanda 13 – если бы их кто-то спросил о том, что они делают.
Эти чуваки умудрились обмануть крупнейшую сеть видео-рекламы, обмануть их алгоритмы выставления цен и распределения рекламы между площадками – их боты "просматривали" в день около 300 миллионов видео-реклам, за каждую из которых они получали около 13$ за просмотр.
Деятельность AFK13 уже сейчас называют одним из самых крупных рекламных интернет-фродов.
В общем это увлекательное исследование от White Ops (Компания по интернет безопасности) на страницах Forbes, рекомендую:
http://bit.ly/2hDQMdj
И спасибо вам всем за участие в голосовании – теперь понятно, что нам всем тут нравится что-то в стиле: алгоритмы машинного обучения, томаты и технологии.
Томатов у меня нет, технологии вроде как есть, а про ML сегодня тихо ;)
👨🏻 Первый опрос на канале – поскольку я сюда скромно скидываю, что считаю интересным (по возможности не дублируя посты популярных техно-блоггеров) и ума не приложу, почему люди подписываются – но спасибо вам всем, я решил всех спросить – Как дела, вы как вообще?
На самом деле нет, окей, не как дела, на самом деле вопрос про то, что вы хотели бы видеть на канале – такого плана, понять в общем хочу вас – тапните в вариант, помогите, м?
Результаты:
1) Я хотел бы видеть новости о нейронных сетях, я человек нейронного плана, порадуйте меня алгоритмами ML: 41 ■■■
2) Я хотел бы видеть посты о технологиях в целом – не так важно, в какой области: 22 ■■
3) Мне, Денис, просто нравится вас читать, пишите о чем хотите: 18 ■
4) Я хотел бы попросить больше разных новостей из всех IT сфер, без фокуса: 5
5) Я – томат: 20 ■
Если вы вдруг хотели бы вечеринки и песни здесь и сейчас, то вам нужно открыть эту ссылку:
http://bit.ly/2h1nWCW
Вы делаете фото, нейронка угадывает что это, text to speech поет об этом – в общем все, что мы так любим и не хуже Глюкозы.
Giorgio Cam это новый проект из серии A.I. Experiments (Помните где вы линии рисовали, а нейронка угадывала что это? Ну вот оно).
Исходный код тут:
http://bit.ly/2hQiFfF
Описание проекта в видео тут:
https://youtu.be/eKeI63VSpto
Стилизацию фотографий под картины мы уже прошли (/channel/denissexy/59), все что нужно для реализации – алгоритм, стиль который берем за основу и фото которое будем обрабатывать.
Теперь пришло время стилизовать аудио – Дмитрий Ульянов и Вадим Лебедев вчера выложили у себя в блоге исходный код под Torch, TensorFlow, Lasagne для стилизации аудио в различные стили. Мне сложно передать восторг, просто посмотрите короткий ролик где футурама стилизована под имперский марш, а Абрахам Линкольн читает Эминема (хоть это и не сам Линкольн).
Тут есть еще больше примеров и описание как это работает:
http://dmitryulyanov.github.io/audio-texture-synthesis-and-style-transfer/
А я, пожалуй, знаю чем займусь на выходные 😍😍😍😍😍
Хорошие новости для людей которые продюсируют поп-группы и которых очевидно нет на этом канале.
Встречайте - ALYSIA, система автоматического синтеза музыки, на основе уже написанного текста.
Как утверждают авторы – это вообще большая проблема, написать под уже написанный текст музыку, поэтому их алгоритм натренированный на попсе, может сильно упростить процесс создания простеньких композиций.
От себя скажу – что ждал этой фигни всю жизнь, так как лучшая шутка – это джингл (на самом деле нет).
По ссылке три примера, не пугайтесь вокала, его синтезировал человек (так себе синтезировал), но музыка получилась не хуже другой попсы точно:
http://www.cs.sjsu.edu/~ackerman/ALYSIA_songs.html
Документ на arxiv.org:
https://arxiv.org/pdf/1612.01058v1.pdf
Исходный код недоступен.
Искусство с помощью технологий получает новые инструменты самореализации – вот к примеру как выглядит «бесконечный холст» созданный художником Горо Фуджиту с помощью приложения для VR Шлема. Рисовалось все это с помощью контроллеров «Oculus Touch VR»
Я в восторге 🐿
https://vimeo.com/194697431
💖💝💖💝💖💝💖💝
Если вы хотели бы сделать своего робота, который отвечал бы вам на вопросы гифками, звуком и двигался, то вам просто необходима эта ссылка: http://imgur.com/a/ue4Ax (по ссылке код и инструкция)
Читать полностью…Ну и раз мы о роботах – Boston Dynamics демонстрирует своего робота на NIPS 2016. Посмотрите видео, разве мы уже не в будущем?
🤖💖🐕
https://t.co/WpuXPITI65
Самый маленький снеговик вам в телеграм, и с наступающим!
Чуваки из Университета Западного Онтарио смастерили самого маленького снеговика –– 3 микрона, или 0.003 мм. Для сравнения, толщина человеческого волоса примерно 75 микрон (0.075 мм).
Использовались три сферы из диоксида кремния 0.9 микрон каждая, соединенные электронной литографией. Глаза и рот прорезаны фокусируемым ионным пучком, а руки и нос вылепили из платины.
В США отменили рейс из-за того, что кто-то расшарил wifi с названием Galaxy Note 7. Я как сознательный человек, сразу прописал себе новое имя для хотспота, мне кажется это очень смешным (или нет).
Читать полностью…Любопытное исследование от Telenor Group Research, MIT Media Lab, Flowminder Foundation и Стокгольмской школы экономики о том, как используя big data сотовой связи и социальных сетей, можно довольно точно определить социальное положение человека. Если коротко – то нейронная сеть позволяет довольно точно определить роль человека в обществе – безработный, клерк и тп, всего 18 ролей.
По информации учёных, это первое в мире исследование такого рода, когда безработных или профессию человека вычисляют на индивидуальном уровне с помощью глубинного обучения по логам сотовой сети. Раньше исследователи пытались предсказать только общий уровень безработицы по мобильным данным, но не профессии конкретных людей.
https://geektimes.ru/post/283938/
#свежий_я
Составил по просьбе TJournal подборку лучших зарубежных мастридов 2016 года (большинство текстов на английском, но с переводами): tjournal.ru/38989-itogi-2016-luchshie-inostrannie-teksti. За последний год я опубликовал на "Мастридах" ссылки на 300+ текстов, но в подборку попали 10 лучших. Поэтому обязательно прочитайте их все, если пропустили.
Любопытный пост о разборе новых наушников Air Pods которые не так давно поступили в продажу – http://bit.ly/2hH80ql
Если коротко – наушники обладают нулевой ремонтопригодностью и залиты внутри клеем, что по моему мнению не большая проблема – так как невозможно ремонтировать, то, что потеряно 👨🏻.
Внутри наушников стоит четыре чипа, главный из которых Cypress CY8C4146FN – ради интереса загуглил его спецификацию – 48-MHz ARM Cortex-M0+ CPU и много еще всего. Если мерить по MHz, то в Pentium 1993 года было 60-MHz, а в лунном модуле 1966 года – 2-MHz.
То есть эти наушники уже сейчас могут – посадить лунный модуль на луну, причем достаточно даже одного. Конкретно эта версия не сможет заменить смартфон, но само направление интересно – будут ли компьютеры (окей, это уже компьютеры, будут ли мощные компьютеры) в ушах? Ну то есть, почему нет, нафига нам дисплей с рабочими аудио-ассистентами?
А еще я мог что-то напутать и сравнивать разные архитектуры это глупо, но все-же забавно 🙈
Я не знаю 3D это или нет (мне кажется да), но это огромный боевой робот который скоро возьмет огромный меч и пойдет искать жалких людишек. В видео сказано, что это «Korea Future Technology», но кто верит этому вашему интернету. http://bit.ly/2h1WB3o
Читать полностью…Это не про айти, но можно сказать про технологии. И про китайцев.
Это видео на 20 минут где китайцы под открытым небом огромным станком обрабатывают заготовку из раскаленного металла с помощью двух погрузчиков.
Обычно такие вещи называют – Some crazy shit right here
http://bit.ly/2hLziMJ
Наверное многие уже видели, но я только сейчас залип https://earthengine.google.com/timelapse/ (открывать лучше не с телефона, не работает)
Это timelaps спутниковых снимков – вы указываете регион, а вам показывают как это регион менялся, ну, если у гугла есть снимки, само собой.
А еще у них клевый VR клиент (/channel/denissexy/69), Google Earth большие молодцы [x]
https://www.youtube.com/embed/HaFhfDzChUk
Не так давно на arxiv.org вышел документ о том как с помощью нейронных сетей (GAN) можно генерировать текстуры каких-либо объектов. Сам документ находится по ссылке: https://arxiv.org/abs/1611.08207
Применений для этой технологий много – было бы здорово получить такой "clone stamp" в фотошопе.
А на видео бесконечная Барселона, вид сверху 👨🏻💃🏻
(Пока явно есть что улучшать, исходный код недоступен)
Генерацией объектов нейронной сетью уже полгода как никого не удивишь (Прошлый пост на эту тему http://bit.ly/2gXERV7, осторжно фейсбук) – потому что выглядит результат генерации – так себе. На arxiv.org документ, о StackGAN, о том как генерировать фотореалистичные объекты из текста – то есть вы задаете текстовое описание в стиле "У птицы желтая шея и живот, серая спина и черные крылья" и в результате вы получаете фотореалистичное изображение этой птицы.
Работает это в связке из нескольких нейронных сетей, как я понял – одна генерирует объект (как по ссылке выше), другая же, находит ближайшую по виду фотографию птицы (вам все еще нужен датасет с птицами) и пытается ее применить к уже сгенерированной картинке.
Результаты как по мне – очень впечатляющие, ниже – пара примеров.
С нетерпением жду, когда появится нейронка который ты Гарри Поттера скормил, а она тебе всех героев сама нарисует и основные сцены. Да что уж, пусть кино генерирует.
Ссылка на документ – https://arxiv.org/pdf/1612.03242v1.pdf
Исходный код недоступен.
P.S. А еще теперь можно генерировать фотореалистичное порно, нужно подключить эту фигню https://open_nsfw.gitlab.io/
P.P.S. Хочу сказать всем Спасибо, кто подписался на мой канал, а также каналу @CatalogChannels, который включил меня в свою подборку интересных каналов. Сап!
«Нейронное караоке» – вот как nvidia называет свой проект, который вы скорее всего видели. Насколько я понимаю, там используется несколько нейронок – одна для визуального распознания образов (image recognition), вторая для генерации текстов (story telling) и третья уже для генерации простенькой музыки. А музыку поет уже какой-то простенький вокодер – а еще на канале автора есть другие примеры.
В общем, как по мне – не хуже группы «Серебро» получилось, да еще и на рождественскую тематику 🤖💖🎄
https://vimeo.com/192711856
https://developers.googleblog.com/2016/12/start-building-actions-on-google.html
Сегодня большой день для всей Google Now платформы, теперь каждый разработчик может делать свои приложения для голосового помощника, а назвали они все это Google Actions. Примерно об этом я писал в своей статье выше (/channel/denissexy/56), это очень здорово с точки зрения расширений функций платформы, наверное вместо Alexa, я таки возьму Google Home.
Окей, home просто дешевле.
https://youtu.be/yJCjVvIY4dU
Нейронные сети неплохо справляются с задачей определения визуальных образов в видео и фото, и давно пора обратить внимание на звук как на дополнительный источник для классификации того, что происходит в видео – что и делает нейронная сеть: SoundNet.
Из видео понятно как она работает, можно даже себя проверить, и попробовать угадать сцену до того как уберется размытие. По моему мнению комбинация визуального и аудио анализа – это прекрасный способ повысить точность определения объектов.
Сеть натренированна на 2 000 000 видео, и вы даже можете скачать исходный код SoundNet, включая модель, по этой ссылке: https://github.com/cvondrick/soundnet
https://www.youtube.com/watch?v=xvIk39rkkiU
Помните стильного робота на воздушных шарах (/channel/denissexy/64)? Ну так вот у него теперь есть прыгающий друг – робот Salto (Saltatorial Locomotion On Terrain Obstacles).
Salto весит около 100 грамм, может прыгать на метр, а самое главное он способен отталкиваться от поверхностей со скоростью 1.75 метров в секунду, причем находясь уже в воздухе.
Так и вижу, включаешь дома свет когда с работы пришел, а они давай скакать по всей квартире, прятаться 🤓