Даже если вы совсем "блондинка", подписавшиcь на канал вы станете разбираться в Data Science - науке о данных. С юмором и простым языком - анализ данных, машинное обучение, нейросети, искусственный интеллект, обо всем таком. по всем ?: @virusandy
И всё-таки, Dall-E пока самая креативная нейронка, рисующая картины. Через нее чаще всего получается нарисовать что-то толковое. Перед вами “котенок-астронавт, картина в стиле Витрувианского Человека Да Винчи”. Сгенерировано с первой попытки через Dall-E:
Читать полностью…А вот и последняя часть статьи про нейрохудожников - что делать, чтоб ИИ не занял ваше рабочее место, и где можно попробовать покреативить самому.
Читать полностью…Часть вторая мини-цикла статей про нейросети-художники. Могут ли нейрохудожники заменить людей?
Читать полностью…Автор вернулся после длительного (запоя? ковида? полета на луну?) перерыва, и планирует вновь радовать вас простыми объяснениями премудростям DataScience. А подтолкнуло к этому то, что автор получил доступ к нейронке Dall-E - той самой, которая рисует картинки по описанию, и заставляет нервно курить дизайнеров и художников.
А дай-ка, думаю, напишу статейку, что это вообще за нейронки такие! Ждите… А пока - пример изображения, как эта нейронка видит автора, вернувшегося с луны, в стиле Ренессанса.
Жена спросила меня, почему я так тихо разговариваю в доме. Я пошутил, что боюсь, что Марк Цукерберг прослушивает меня. Жена в ответ засмеялась. И Алиса засмеялась. И Сири тоже.
Хороший анекдот, и в принципе проблема прослушки действительно актуальна. Про все эти голосовые помощники наверняка ещё будут скандалы с хакерами, получившими доступ к чужим микрофонам.
А пока скандалов нет, чтоб не заскучать - изучим что это вообще такое - распознавание речи
#распознаваниеречи #speechrecognition
В продолжение предыдущего поста: что такоое доверительный интервал, уровень доверия, и как они влияют на АБ-тесты
Внутри - ужасная история, не пропустите!
Мы то знаем, как было на самом деле:
if (rise_of_the_machines) use_swords();
Красиво ли в Случайном лесу?
Спойлер: Если вы любите все делать от балды - этот алгоритм вам определенно понравится!
#алгоритмы #случайныйлес #randomforest
⬇️ читаем статью ⬇️
Пояснение к шутке выше - для самых маленьких.
Питонист - программист на языке Python, очень популярный в DataScience.
Дата Сайентист - занимающийся Data Science.
Искусственный Интеллект - маркетинговая фикция, которая якобы есть в каждом новом телефоне/автомобиле/утюге.
Рандомный подбор коэффициентов - про это напишу отдельную статью, по сути это "угадывание".
Кросс-валидация (перекрёстная проверка, скользящий контроль) - проверка модели на других данных, не на тех, на которых шло обучение.
Нормальный результат кросс-валидации - когда кросс-валидация показывает, что вы составили годную предсказательную модель (угадывающую более чем в 55-60% случаев, а лучше ближе к 100%).
С ув., Ваш Кэп.
Меню канала с основными постами.
Основы Data Science, алгоритмы.
1. Data Science
2. Big Data
3. Data Mining
4. Нейросети
5. Задача про Титаник
6. Регрессия, регрессоры. Классификаторы.
7. Деревья решений
8. Наивный Байесовский классификатор
9. Метод K-ближайших соседей
Визуализация.
1. Визуализация данных
2. Тепловые карты
Истории о нейросетях
1. Пример работы нейросети на примере боев сумо
2. Нейросети и распознавание порноактеров
3. Нейросети и трейдинг
4. Нейросети и видеослежка
Истории из жизни.
1. Айфон-психолог
2. Магазины вычисляют вашу беременность
3. Знакомство с помощью Data Science
4. Знакомство с помощью Data Science - 2
5. Про машинный перевод
Наткнулся на интересную игру - симулятор Data Scientist’a и его кота 😄
В процессе игры нужно либо работать программистом-фрилансером, либо техническим директором в стартапе. При этом понарошку решать игровые задачи, взятые из настоящего Data Science мира, так что игра может быть интересна желающим получить представление об этой сфере. Ну а заработанные деньги можно тратить в игре на себя и на кота 😺
В общем, хоть автор канальчика давно уже практически не играет, но эта игра показалась очень интересной. Решил купить, поиграть - даже в steam зарегистрировался)
https://store.steampowered.com/app/619150/while_True_learn/
#игры #whiletruelearn
Доброго утра, дорогие читатели!
Да, я (автор канала) жив, и даже помню, что есть у меня такой канал. Цветов не надо. Вот стаканчик виски или хорошего пива - это можно.
Куда пропадал - объяснять не буду, а вот канал возрождать - буду. Формат канала немножко поменяется - будет, как и в первое время, больше упоминаний интересных новостей с моими комментариями.
Ну а начнем мы, не угадаете, с полурекламной статьи. Но не торопитесь плеваться! Верные читатели помнят, что рекламы в классическом виде на канале никогда не было. Так и в этот раз - сейчас будет не столько реклама, сколько персональная рекомендация.
Ко мне обратилась представитель Нетологии (онлайн-университет, если кто не знает) и, несмотря на то что я давно ничего не писал, попросила помочь донести до заинтересованной аудитории информацию: 1 марта начинается очередной поток курса по специальности Data Scientist.
И что же там делать, спрашивается? "Прокачайте навыки работы с рекомендательными системами, машинным зрением и NLP", говорила она. "Научитесь создавать и обучать нейросети", добавила вслед. Я задумался, а она не останавливалась: "5 месяцев, 100+ часов практики". Пока я переваривал, меня добивали: "преподаватели - эксперты из “Яндекс”, “СберТех”, “Ростелеком”, ivi ru и других ведущих компаний отрасли."
А пока я набирал воздуха, чтобы рявкнуть "хватит!", пришел контрольный выстрел: "По кодовому слову ACCURACY - скидка на программу 20 000 руб. и онлайн курс Нетологии “Big Data: основы работы с большими данными” в подарок!"
Короче, вот вам ссылка: http://netolo.gy/ecX - там подоробности, и не забывайте промо-код ACCURACY.
Нетология толково учит, и условия довольно хорошие. Так что что моим верным читателям это может быть интересно. Заодно и я к каналу вернулся.
До следующих статей!
А вот этот же запрос, полученный через Stable Diffusion после многократных попыток генерации c отсевом бессмыслицы:
Читать полностью…Количество проектов, занимающихся генерацией изображений по тексту, все увеличивается и увеличивается. Сейчас набирает популярность еще один - Stable Diffusion от stability.ai. Отдельного сайта у проекта пока нет, доступ - ограничен (но если постараться - получить можно). Но из тех нарисованных картин, что выложены в сеть, выглядит как достойный конкурент Dall-E.
По обзорам выглядит, что стилистика - ближе к стилю Midjourney, сказочно-мультипликационному, чем к фотореалистичному стилю Dall-E. Но мои тесты показали, что и в фотореалистичность Stable Diffusion умеет. В числе других отличий от конкурентов - заявлены более слабые фильтры запросов, что позволяет генерировать, например, более вольные картинки. Или изображения с лицами известных личностей. Другие виды фильтров - пока обсуждаются, но насилие или слишком вольные картинки (вы поняли, да) явно будет запрещено и тут.
Погоняв Stablfe Diffusion, мне показалось что у нее менее богатое воображение, чем у Dall-E, но это только первое впечатление. Если вы помните предыдущую статью, самое главное при работе с нейрохудожниками - умение правильно составить запрос. А так же очень много времени. (Когда-нибудь на пенсии автор блога, не умеющий рисовать руками, станет AI художником, творящим чудеса запросами, а пока…)
А пока вот вам по-быстрому нарисованный с помощью Stable Diffusion котенок на пляже, и он желает всем хорошего дня:
Ну что, всех с окончанием рабочей недели! Попросил Dall-E сгенерировать “айтишников на вечеринке в честь конца рабочей недели”. Получилось не очень, но вы знаете почему - из предыдущего поста. (Третья часть на подходе, stay tuned!)
Читать полностью…Долгожданная статья про нейросетки-художники готова! Но очень уж объемной получилась, так что разбил её на три части.
Часть первая, вводная. Как работают нейросети для генерации картинок - на примере Dall-E
Внутри - в том числе веселые картинки, само собой.
Помните бота Олега от Тинькова? Того, который на нейросетях, и обучали его, по слухам из интернетов, якобы на речах другого Олега. Так вот, действительно ли Олег обучил Олега - узнаем завтра у главного по Олегу) /channel/conversations_spb/33
Читать полностью…Отстраненных размышлениий пост.
Сейчас сезон отпусков, а одно из популярных отпускных направлений у нашего русскоязычного собрата - это турецкие отели. Мне всегда было интересно, что в них мешает совместить цветные браслеты (позволяющие отличать "своих" клиентов отеля от других) и магнитные пластиковые карты для открывания двери. И вот похоже отели к этому таки идут. В отеле/парке развлечений Land of legends в браслет зашивают RFID-метки, которые затем используются для идентификации и бесконтактной оплаты. Теперь можно не бояться потерять по пьяни магнитную карточку (тем более любимого туристами all-inclusive там нет, но мы ж не про это).
С одной стороны, владельцы лавочки в однозначном выигрыше - ведь с такой системой их работникам ни один пакетик попкорна не удастся продать мимо кассы себе в карман. А с другой стороны - стало интересно, а как же с безопасностью технологии? Есть ли шифрование? Не подебажить ли содержимое RFID-метки, а вдруг там баланс хранится простым числом, и поменяв 0 на 5000 можно будет идти шиковать 😂 ? Наверняка кто-то дойдет до таких же мыслей и найдет интересные несовершенства у данной реализации, как когда-то было с банковскими картами. (Разумеется, это не призывк к действию, и никакой ответственности автор не несёт.)
А если подумать что будет дальше? Дарю идею для стартапа, кто прочитал и пошел реализовать - заносите % с прибыли 😉!
Следующее поколение систем, после браслетов с чипами, будет основано на распознавании лиц. Особенно в тех отелях, в которых браслеты не используют по причине эксклюзивности и соответствующих эксклюзивных цен (не путать с отелями обычной ценовой категории, которые браслеты не используют только из-за экономии на браслетах 😄). Последние годы направление распознавания лиц развивается невиданными темпами, и качество определения достаточно велико. Технологии становятся всё более обкатанными, дешевеют - прямо как и любые другие технологии ML/DS. Так что технически ничего не мешает разработать програмный комплекс, который будет фиксировать лица клиентов при регистрации, а дальше распознавать их - при входе на территорию отеля (и выводить соответствующую информацию на монитор охраны), для разблокировки двери номера, для идентификации кому выставлять счет за платные доп.услуги, и в целом для видеонаблюдения охраной за территорией отеля - все человечки на мониторе будут подписаны и кликабельны. Всё это можно делать скрытно для людей, а не "таак, теперь посмотрите вот в эту камеру, сидя прямо". Настоящий сервис, почувствуй себя знаменитостью, которую все знают!
Конечно, так же как и с магитными браслетами, возникнет вопрос надежности: а что, если надеть чью-нибудь маску? Но такие вопросы были, есть и будут всегда. По крайней мере, ходить в маске - заметнее, чем с поддельной картой/браслетом)
А вы что думаете, какая из технологий удобнее?
🗝 - конечно же ключи - классика, проверенная веками
💳 - магнитная карта, ты поменьше бухай - и не потеряешь, не сломаешь
📿 - браслет пожалуй, красиво и удобно
👁 - а мне нравится, когда меня по лицу распознают и узнают
🌴 - мне без разницы, хочу в отпуск!
#cv #распознаваниелиц #размышления
Ура, после долгого перерыва - канал начинет пополняться новыми статьями!
И не только про Data Science, но и про более приземленные вещи. Например, как правильно считать маркетинговую аналитику.
Начнем с малого: что такоое АБ-тесты
Ещё один смешной мем))
(Для тех кто не понял. Намек на то, что датасайнтисты не всегда могут похвастаться программистским образованием и опытом. Рациональное звено в шутке есть😏)
Пока автор канала в затяжном творческом отпуске, где-то постят шутки про ML ))
Кстати, дорогие читатели. Если вам хочется узнать что-то про ML - пишите в лс интересующую тему. Возможно она покажется интересной, и вы получите максимально понятный, как всегда, материал)
Печально, но telegra.ph открывается в РФ не у всех. Так что новые статьи будут в Яндекс Дзен.
А пока - поризвел репликацию ранее вышедших материалов.
«Автор, что ты там несёшь?», спрашивают на этом месте дорогие читатели. Ой, и действительно, буду проще:
А пока - скопипастил каждую прошлую статью с Телеграфа в Дзен 🙂
Вот ссылка на канал в Дзен: https://zen.yandex.ru/id/5b31751bc898ca00a9199051
Подписывайтесь сами, и друга/подругу подписать не забудьте, и к соседу ради такого случая зайдите))
Как самому вырастить дерево решений?
Спойлер: Вольный пересказ статьи с красивыми картинками
#дереворешений #визуализация
⬇️ читаем статью ⬇️
Приветствую! Если почитать мой канал, то многие сложные и страшные слова кажутся не труднее уроков труда в третьем классе. Но, на самом деле, наука анализа данных (и смежные области) достаточно серьезная, и многим из вас будет интересно почитать и другие источники информации. Рекомендую ознакомиться ниже с подборкой каналов по "нашей" тематике. Ну а сам буду радовать и дальше максимально доступными объяснениями. Stay tuned ;)
Читать полностью…Доброго времени суток, доргие читатели!
Лето приближается, и вместе с этим у аффтара канала вновь появляется вкус к писательству, по стечению обстоятельств покинувший писателя на полгода. Если вы уже забыли, что это за канал и где вы вообще, напоминаю. Это telegram-канал про Data Scince - науку о данных и связанные с этим новости, технологии. На котором я объясняю все эти вещи максимально понятным языком. Даже домохозяйкам. Даже тем из них, кто с гуманитарным образованием.
Сегодня, в качестве затравки, пересказываю свежайшую историю о голосовых помощниках. (Голосовые помощники - это такие программы, встроенные в разную технику, которые распознают команды голосом и выполняют им. Например, Алиса от Яндекса, или Сири от Apple.)
Сейчас речь пойдет о голосовом помощнике Алекса, встроенном в умные устройства Echo от Амазон. Знаете, есть такая весьма популярная за бугром колонка, подключаемая по Bluetooth и WiFi к компьютеру/планшету/смартфону. Умеющая выполнять разные команды, как телефонные помощники. Так вот, эта милая колонка на днях стала героем скнадала.
"Мой муж шутил со мной, что ставит на то, что наши умные устройства подслушивают то, о чем мы разговариваем", рассказывает героиня истории Даниэла. «А через две недели мне позвонил мой сотрудник и рассказал о полученном странном сообщении. И посоветовал сейчас же отключить Алексу, потому что меня взломали через нее."
Оказалось, Алекса отправила голосовое сообщение, содержащее приватные разговоры Даниэлы и её мужа, которые, естественно, никто не просил никому отправить. Даниэла, не будь дурой, уведомила Амазон, разработчика этого "умного" помощника. Вместе они восстановили картину случившегося. Оказалось - череда невероятных совпадений. Алексе послышалось (или же реально было сказано) слово "Алекса", которое для неё является сигналом, что далее будет команда. Как назло, одна из фраз далее была "отправить сообщение", и Алекса немедля приготовилась это делать. И даже уточнила - кому отправлять будем, хозяин-барин? Но грормкость была на минимуме, и её не услышали. Зато Алекса всё внимательно слушала, и интерпретировала одну из следующих фраз как название одного из контактов. После чего уточнила "Отправляем сообщение такому-то, правильно?" и получила "ответ" (на деле - случайно совпававшую фразу) что мол да, отправляем. Что и было сделано.
В связи с этой историей возникло много вопросов на тему безопасности проникновения подобных устройств в дома. Об этом возможно напишу отдельную статью, спойлер: скоро мы услышим о взломах через голосовые помощники, которые услышали команды через музыку/ТВ/громкую связь.
Лично у меня ко всей этой истории возник ещё один вопрос. Благодаря чему Амазон так подробно смог разобраться в истории, и в частности во всех нюансах того, что слышала Алекса? Никого не хочу обвинять, но мне кажется вы тоже всё поняли.
А если вы спросите "какое отношение Дата Сайнс имеет ко всему этому", отвечу: самое прямое! Вся эта байда стала возможна лишь с попустительства постоянно изобретающих что-то датасайнтистов.
Хочешь поработить вселенную - изучай датасайнс, делай умный девайс, и через него захватывай мир 😉
http://money.cnn.com/2018/05/24/technology/alexa-secret-recording/index.html -источник истории на английском
#голосовыепомощники
Недавно была статья про тепловые карты. И в качестве одной из иллюстраций была карта фондового рынка.
Наткнулся на онлайн-карту рынка криптовалют: http://cryptomaps.org/
Для тех, кто отслеживает эту тему - очень удобно. Открыли - и сразу видно, какие ведущие валюты куда «прут».