Основы полнотекстового поиска в ElasticSearch. Часть вторая
В первой части мы поговорили про самые базовые понятия ElasticSearch. В этом же посте разберём устройство анализа текста и немного пощупаем полнотекстовый поиск.
«Привет, Хабр! Меня зовут Александр Фикс, я менеджер по развитию бизнеса КРОК Облачные сервисы. Сегодня поговорим о тренде локализации, о том, что происходит на рынке файлообменников с уходом западных решений и какие альтернативные продукты есть у бизнеса в данный момент»
Незаменимых нет. Сервис на базе Nextcloud вместо привычных корпоративных облаков
«Недавно я прочёл запись в блоге одного парня, который жаловался, что на интервью его попросили написать функцию, которая должна скопировать файл. Нет, я понимаю, как можно взъесться на такое задание, но если бы в подобной ситуации оказался я… уж я бы оторвался по полной»
«Кандидат имеет право задавать уточняющие вопросы», или Доводим интервьюера до нервного срыва
#хабраархив
Медичи: семья, которая изобрела современные банки
Медичи — это те самые люди, благодаря которым мы знаем черепашек-ниндзя: они всячески поддерживали художников и скульпторов. Это был самый эффективный метод пиара тех лет. Так, Козимо де Медичи взял под своё покровительство Донателло, а Лоренцо ди Пьеро де Медичи заметил молодого Микеланджело и привлёк его к архитектуре Флоренции. Разумеется, всё это семья делала не просто так, а потому что они настойчиво и целеустремлённо захватывали влияние и потом защищали свои инвестиции.
Зачем компаниям джуны-разработчики: куда и для каких задач их нанимают
Вика Очоа, руководитель карьерного центра курсов направления веб-разработки в Яндекс Практикуме, рассказывает, зачем работодателям джуны, каким компания они нужны, с какими задачами сталкиваются, а главное — как развиваться начинающему разработчику, чтобы быть конкурентоспособным.
Нулевая энергия квантовой системы не равна нулю — и это проблема современной космологии
Энергия нулевой точки, или нулевая энергия — это минимально возможная энергия, которой может обладать квантовомеханическая система. В отличие от классической механики, квантовые системы постоянно колеблются вокруг состояния наименьшей энергии — об этом говорит принцип неопределённости Гейзенберга. Поэтому даже при абсолютном нуле атомы и молекулы сохраняют некоторое колебательное движение. Кроме атомов и молекул, этими свойствами обладает и пустое пространство — вакуум. Согласно квантовой теории поля, Вселенную можно представить не как набор изолированных частиц, а как непрерывные колеблющиеся поля: поля материи, квантами которой служат фермионы (т. е. лептоны и кварки), и поля сил, квантами которых являются бозоны (например, фотоны и глюоны). Все эти поля обладают энергией нулевой точки. С какой-то точки зрения можно сказать, что все эти колеблющиеся поля напоминают нам старую теорию об эфире — некоторые системы позволяют обнаружить эту энергию.
Понятие энергии нулевой точки важно и для космологии, и в настоящее время в физике отсутствует полная теоретическая модель для понимания энергии нулевой точки в этом контексте. В частности, источником серьёзных разногласий служит расхождение между теоретической и наблюдаемой энергией вакуума. Физики Ричард Фейнман и Джон Уилер рассчитали, что излучение нулевой точки вакуума на порядок превышает ядерную энергию, а энергии одной лампочки будет достаточно для того, чтобы вскипятить весь Мировой океан. Однако, согласно общей теории относительности Эйнштейна, любая подобная энергия должна оказывать гравитационный эффект, а экспериментальные данные о расширении Вселенной, тёмной энергии и эффекте Казимира показывают, что эта энергия исключительно слабая.
«Недавно мы публиковали историю про австралийскую медицину, и один из наших читателей вспомнил, как он чуть было не стал одним из индусов (в переносном смысле)»
Как один хитрый китаец не хотел работать, а деньги получать хотел
«Сегодня вы узнаете о моей мотивации привносить жизнь старым смартфонам, о тонкостях разработки мобильных приложений, чем Windows Phone был на голову выше Android в техническом плане и о том, почему провал Windows Phone — одна из самых больших потерь мобильного рынка»
Не дадим Windows Phone умереть! Пишем свои клиенты VK и YouTube для Nokia Lumia
Проектируем самодельный 16-битный CPU в 2023 году
Для создания самодельного CPU требуется большое количество чипов логики. И в самом деле разумно, что для реализации регистров, счётчика команд, АЛУ и других компонентов CPU на логике TTL или CMOS действительно необходимо существенное число чипов. Но сколько конкретно?
Автор статьи попытался оптимизировать свой самодельный CPU, минимизировав количество чипов логики, чтобы выяснить, какое минимальное число интегральных схем требуется для полного по Тьюрингу CPU без CPU.
Классификация грибов методами ML
Автор статьи рассказывает о том, как обучал различные модели машинного обучения отличать съедобные грибы от несъедобных, с какими сложностями столкнулся в процессе и какие интересные наблюдения про грибы и ML открыл по пути.
«Привет, Хабр! Меня зовут Макс Баюров, я PHP-разработчик в компании AGIMA. Мне хотелось бы поделиться с вами опытом расширения уровней доступа к функционалу сайта. Если вам ещё не приходилось с этим сталкиваться или этот процесс вызывает трудности, сейчас всё расскажу»
Пользовательские (кастомные) уровни доступа к функционалу на примере CMS Bitrix
⚡️ Новости к этому часу
🕹️ В продажу поступил аркадный контроллер Razer Kitsune с оптическими переключателями
💰 Язык программирования Elixir экономит Pinterest $2 млн в год на затратах на серверы
📱 Google запускает новый способ работы с данными BigQuery Studio
🇮🇳 Индийский луноход «Прагъян» сфотографировал посадочный модуль «Викрам» миссии «Чандраян-3» (ФОТО)
🤖 В Корее разработали мягких роботов, которые самоуничтожаются без следа
💻 В первой половине 2023 года продажи лицензий на Microsoft Windows в РФ сократились на 78% по сравнению с прошлым годом
🎮 В Steam открылась предзагрузка Starfield
🔝 Барселона возглавила рейтинг городов для удалённой работы
#новости
Автоматизация бурления: ChipArp
Наиболее знаковым атрибутом видеоигровой музыки 1980-х, несомненно, является арпеджио — технический приём, служащий обогащению гармонии в условиях крайне ограниченной полифонии. Получающееся в результате специфическое «булькающее», «бурлящее» звучание стало в сознании масс своего рода визитной карточкой 8-битной музыки, вызывающей мгновенное узнавание.
Как ни странно, несмотря на многократно выросшую с тех пор мощность современных компьютеров и синтезаторов, в современном музыкальном ПО этот классический приём стал менее доступен, чем раньше. Поговорим о том, почему так вышло.
Нужна ли вам Kafka? Разбираемся в технологии и собираем простое приложение на базе managed-решения
Kafka — стильная, модная, молодёжная технология, которую разработала в 2011 году компания LinkedIn и значительно усовершенствовал Apache Software Foundation. Представляет собой надёжный, масштабируемый и устойчивый инструмент для обработки и передачи данных в режиме реального времени — шину данных.
Но нужно ли внедрять технологию в угоду моде или амбициям вашего продуктового менеджера? Поговорим про сильные стороны Kafka и задачи, в которых она раскрывается по максимуму, а также напишем быстрое приложение на базе Kafka-as-a-service.
Как в «Домклик» создали систему развития и карьерного роста продуктовых дизайнеров
Древняя мудрость гласит: «Театр начинается с вешалки, а путь к должности дизайн‑директора — с первого шага». Но что ещё нужно сделать? Как превратить свою мечту в реальность и не сбиться с пути? Спросим у дизайн-лида в «Домклик» Артёма Литвина.
«Документацию рядом с кодом мы ведём уже 6 лет, она делится по слоям: фронт, миддл и бэк. С миддлом всё хорошо, а вот с фронт-документацией всё портят изображения экранных форм. От них репозиторий раздувается, как ипотечный пузырь на льготных ставках.
Но, кажется, эту напасть удалось побороть. В статье я расскажу, как вести фронтовую документацию рядом с кодом и к каким последствиям это приводит»
Docs as Code: как вести фронтовую документацию рядом с кодом, чтобы репозиторий не раздуло
Накопители на магнитной ленте начинают и выигрывают: технология продолжает совершенствоваться десятилетия спустя
Относительно недавно был анонсирован стандарт LTO-9, а сейчас появился новый, ещё более ёмкий накопитель. На одном носителе теперь можно записать около 150 ТБ данных, что примерно в три раза больше по сравнению с LTO-9.
LVM+QCOW2, или Попытка создать идеальный CSI-драйвер для shared SAN в Kubernetes
Используя кластерный LVM и файловый QCOW2-формат, мы можем получить всю функциональность thin provisioning, почти не потеряв в производительности. Это позволяет реализовать быстрый и, главное, универсальный драйвер для подключения и эффективного использования любой SAN-подобной системы хранения данных в Kubernetes.
ДДТ: как пестицид из панацеи превратился в проблему
Пестицид ДДТ, изобретённый во время Второй мировой, спас миллионы жизней и помог сохранить огромное количество продовольствия. Но увлёкшись широким применением чудодейственного средства, правительства и простые потребители начали пренебрегать оборотной стороной его действия. Поговорим о том, как мир сначала боготворил ДДТ, а затем возненавидел его — и как эти общественные аффекты помешали установлению научной истины, куда более сложной и неоднозначной.
⚡️ Новости к этому часу
🌌 Астрономам удалось точно измерить свойства аккреционного диска чёрной дыры
🎮 Появились первые оценки критиков и обзоры на Starfield
🩺 Обанкротился телемедицинский стартап Babylon Health — на пике популярности его оценивали в $4,2 млрд
💻 Пользователям Chromebook открыт бесплатный доступ к сервису Nvidia GeForce Now Priority или Ultimate на три месяца
🌔 НАСА опубликовало фото нового кратера на Луне, который, вероятно, появился после падения «Луны-25» (ФОТО)
🎮 Локальная консоль Sony PlayStation Portal поступит в продажу 15 ноября
📱 Google перешла на более короткий цикл формирования релизов Chrome
🙅🏻♂️ AMD отказалась от разъёма 12VHPWR в новых Radeon
#новости
Графовый анализ: как вычислить первый фрод или увольняющегося сотрудника (первые шаги)
Любая организация в значительной степени зависит от действий людей: клиентов, партнёров, своих сотрудников. И все люди — разные: одни — добросовестные и честные, другие — хитрые и не прочь обмануть, третьи — слабовольные и зависят от чужого влияния.
И вопрос оценки надёжности людей, взаимодействующих с компанией, всегда актуален. Чем точнее будет эта оценка, тем в более выгодном положении будет компания и тем меньшими средствами она рискует. Чтобы управлять всеми этими факторами и, более того, прогнозировать на основе получаемой извне и изнутри информации свои действия, сегодня используются системы графовой аналитики.
Обсудим, что это, как работает и что с этим можно делать
⚡️ Новости к этому часу
✈️ Белорусская национальная авиакомпания «Белавиа» перейдёт на российскую систему бронирования «Леонардо»
🛠 AMD опубликовала открытый исходный код прошивки SEV
🔭 «Уэбб» заснял космический Водоворот
⚖️ Фонд развития интернет-инициатив подал в суд на основателей закрывшегося сервиса для автопубликации постов «Амплифер»
✅ JetBrains объявила о поддержке Wayland на платформе IntelliJ и в OpenJDK
👨🏫 Skillbox запустил аналог Coursera с курсами топовых вузов
💳 Актриса озвучки подала в суд на «Тинькофф» за использование её голоса в других проектах без разрешения
🎮 1С Game Studios показала трейлер игры «Война Миров: Сибирь» (ФОТО)
#новости
«Я до сих пор вспоминаю этот компьютер с теплотой. Было в нём что-то, не передаваемое словами — какая-то внутренняя энергия, превращавшая работу в приятное и увлекательное занятие»
«Поиск» истины. История ПЭВМ «Поиск» от его создателей
Стажировки в компаниях на Хабр Карьере.
Копирайтер в FreshForex. Можно удаленно. От 25 000 ₽.
IT-рекрутер в Yoles. Санкт-Петербург. Можно удаленно. От 60 000 ₽.
Разработчик Go в Флексибейс. Неполный рабочий день. Можно удаленно. До 35 000 ₽.
Стажер-бухгалтер в АйТи Бастион. Москва. Неполный рабочий день. 30 000 — 35 000 ₽.
SMM-специалист в KPD media. Неполный рабочий день. Можно удаленно. 10 000 — 15 000 ₽.
Больше вакансий
#intern
⚡️ Новости к этому часу
🖥 В МГУ готовится к запуску новый суперкомпьютер производительностью 400 петафлопс
🙀 Международная группа исследователей обнаружила гидрид олова со свойствами «странного» металла
👏 На Большом адронном коллайдере обнаружены редкие «гиперядра»
📱 Представлен модульный смартфон Fairphone 5 с десятилетней поддержкой ПО и пятилетней гарантией (ФОТО)
🎮 Sony объявила о повышении стоимости годовой подписки PS Plus
💻 Microsoft объявила о прекращении поддержки Visual Studio для Mac после августа 2024 года
🛰 Система дальней связи НАСА столкнулась с проблемой критических нагрузок научных миссий
⚽️ Российская компания СМП ESports планирует в течение трёх лет «начать разрабатывать» футбольный и хоккейный симуляторы
#новости
Будьте смелее! Заканчивайте каждое утверждение восклицательным знаком!
print("Hello world")!
Если вы чувствуете себя особенно смелым, вы можете использовать ещё больше!!!
print("Hello world")!!!
Если вы не уверены, ничего страшного. Вместо этого вы можете поставить вопросительный знак в конце строки. Он выводит для вас отладочную информацию об этой строке в консоль.
print("Hello world")?
DreamBerd — идеальный язык программирования
Почему E = mc² — это лишь половина описания происходящего
Уравнение E = mc² описывает, сколько энергии присуще любой массивной частице, находящейся в состоянии покоя, включая то, сколько энергии требуется для её создания и сколько энергии выделяется при её разрушении.
Но что, если частица не находится в состоянии покоя или если она вообще не имеет массы? В этих случаях E = mc² — это только половина значимого уравнения. Вторая половина гораздо интереснее и необходима для того, чтобы понять физический смысл происходящего.
Мы сами себя обманули с Биткоином
Вы идёте в продуктовый магазин, хотите купить бутылку молока. Бутылка стоит $601, транзакция идёт 5 часов, и стоимость бутылки за эти 5 часов прыгает от 500 до 700.
Как вам такое будущее? А ведь именно это и продвигают бешеные криптоманы.
Представьте, что ваш денежный ресурс неограничен и у вас есть сутки на то, чтобы «сломать Интернет». Экстремальные варианты вроде «взорвать Землю» или «убить всех человеков» не берём. Ваши действия?
По мотивам поста «Можно ли "сломать" Интернет?».
#болталка
Как сделать двухфакторную аутентификацию через SMS в своём приложении
Добавление двухфакторной аутентификации в веб-приложение — самый простой способ уменьшить количество спама и мошенничества на своём сайте, обеспечив при этом безопасность пользователя. Двухфакторная аутентификация защищает от фишинга, атак методом социальной инженерии и перебора паролей. Даже если пароль пользователя скомпрометирован, этого недостаточно, чтобы предоставить злоумышленнику доступ к аккаунту в вашем приложении: без утверждения второго фактора пароль сам по себе бесполезен.
Технический писатель МТС Exolve Анастасия Иванова рассказывает, как реализовать двухфакторную аутентификацию в веб-приложении на NodeJS, и объясняет, как отправлять одноразовый код через SMS API, используя сервис MTC Exolve