That's just link aggregator of everything I consider interesting, especially DL and topological condensed matter physics. @EvgeniyZh
How to factor 2048 bit RSA integers with less than a million noisy qubits https://arxiv.org/abs/2505.15917
Читать полностью…Training superhuman coding models at Cursor
Случайно наткнулся на видео, где ребята из Cursor обсуждают всякое разное про LLM. Обычно в подобных подкастах все высказывания очень поверхносные, чтобы случайно не выдать каких-нибудь секретов. А тут на удивление упомянули довольно много технических деталей.
Краткий список затронутых тем:
- Как делать RL, когда нет одного правильного ответа?
- Что делать, если вероятность получить "правильный" ответ очень маленькая?
- Как сделать, чтобы модель могла ориентироваться в большом проекте?
- Как поддерживать long context?
- Как делать credit assignment для memory tool?
- Как cursor может обучаться на пользовательских данных.
- Почему плохо смотреть на лайки/дизлайки ответов.
- Какая инфра нужна для больших RL тренировок.
Судя по количеству просмотров, если сам этим не занимаешься, то смотреть не очень интересно. Но мне понравилось!
Generalization Bias in Large Language Model Summarizati https://arxiv.org/abs/2504.00025
Читать полностью…Enumerate-Conjecture-Prove: Formally Solving Answer-Construction Problems in Math Competitions https://arxiv.org/abs/2505.18492
Читать полностью…SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents https://arxiv.org/abs/2505.20411
Читать полностью…Pauli Propagation: A Computational Framework for Simulating Quantum Systems https://arxiv.org/abs/2505.21606
Читать полностью…I used o3 to find a remote zeroday in the Linux SMB implementation (Score: 161+ in 6 hours)
Link: https://readhacker.news/s/6v2yL
Comments: https://readhacker.news/c/6v2yL
CLEVER: A Curated Benchmark for Formally Verified Code Generation https://arxiv.org/abs/2505.13938
Читать полностью…Does Earth have two high-tide bulges on opposite sides? (2014) (Score: 151+ in 9 hours)
Link: https://readhacker.news/s/6uVvc
Comments: https://readhacker.news/c/6uVvc
Ordering the topological order in the fractional quantum Hall effect https://arxiv.org/abs/2505.14767
Читать полностью…XX^{t} Can Be Faster https://arxiv.org/abs/2505.09814
Читать полностью…Higher symmetries and anomalies in quantum lattice systems https://arxiv.org/abs/2505.04719
Читать полностью…Improving Assembly Code Performance with Large Language Models via Reinforcement Learning https://www.arxiv.org/abs/2505.11480
Читать полностью…Size based vector
https://discourse.llvm.org/t/adding-a-size-based-vector-to-libc-s-unstable-abi/86306
Мы тут в Гугле экспериментировали с тем как репрезентовать вектор. Существует два способа:
1. Указатель на начало, конец и указатель на конец вместимости
2. Или указатель на начало, размер и вместимость
Оба варианта имеют свои особенности и слабые места. Первый вариант плох тем, что когда вы хотите посчитать size(), то вы вычитаете два указателя: end - begin. Вычитание указателей в численном представлении эквивалентно формуле (end_as_num - begin_as_num) / sizeof(T), где T -- тип вектора. Вот это деление на константу порой выбешивает, например, когда sizeof(T) не является степенью двойки. Компилятору приходится это деление переводить в умножение и теперь когда вы вызываете size(), то у вас откуда-то страшные конструкции вида https://godbolt.org/z/zKGz7nEE6
Но первый вариант неплох, когда вы итерируетесь и надо просто сравнивать с концом. Почему? Во втором варианте вам надо при вызове .end() загружать два регистра -- начало и размер, чтобы сложить. В итоге у вас баланс между двумя опциями
.size() выливается в умножение при sizeof(T) не степень двойки
.end() загружает два регистра
Остальные операции чуть чуть поменяются, но в основном размен происходит у этих двух.
Оказалось, что .end() чаще вызывается один раз, а .size() намного чаще в том числе и внутри циклов, потому что... Ну потому что программистам удобнее работать с числами, а не указателями. Или по каким-то ещё причинам.
В итоге мы увидели улучшение перфа всего прода на 0.12% с особенно важными серверами с исправлениями на 0.5-0.6%, о чем и поделились в discourse.llvm. Понятное дело, что кто-то слишком сильно пользовался репрезентацией вектора, но мы всех их починили и выкатили. Теперь хотим выкатить и в unstable ABI в libcxx.
Почитайте ссылку, там больше всяких анализов, в том числе и размер кодгена, и всякой ещё статистики.
A Lean companion to Analysis I (Score: 150+ in 6 hours)
Link: https://readhacker.news/s/6vp2P
Comments: https://readhacker.news/c/6vp2P
Quantized Transport of Disordered Superconducting Fractional Quantum Hall Edges https://arxiv.org/abs/2505.20398
Читать полностью…Disturbing news about the d=2+ε expansion https://arxiv.org/abs/2505.21611
Читать полностью…Generalized Hall Conductivities in Local Commuting Projector Models: Generalized Symmetries and Protected Surface Modes https://arxiv.org/abs/2505.20384
Читать полностью…Seed1.5-VL Technical Report https://github.com/ByteDance-Seed/Seed1.5-VL/blob/main/Seed1.5-VL-Technical-Report.pdf
Читать полностью…Solving the fractional quantum Hall problem with self-attention neural network https://journals.aps.org/prb/abstract/10.1103/PhysRevB.111.205117
Читать полностью…Long-RVOS: A Comprehensive Benchmark for Long-term Referring Video Object Segmentation https://arxiv.org/abs/2505.12702
Читать полностью…When AI Co-Scientists Fail: SPOT-a Benchmark for Automated Verification of Scientific Research https://arxiv.org/abs/2505.11855
Читать полностью…String-Membrane-Nets from Higher-Form Gauging: An Alternate Route to p-String Condensation https://arxiv.org/abs/2505.13604
Читать полностью…Partons from stabilizer codes https://arxiv.org/abs/2505.02683
Читать полностью…Exotic Carriers from Concentrated Topology: Dirac Trions as the Origin of the Missing Spectral Weight in Twisted Bilayer Graphene https://arxiv.org/abs/2505.08779
Читать полностью…Geometrically Enhanced Topological Quantum Codes https://arxiv.org/abs/2505.10403
Читать полностью…AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
Читать полностью…