aipulse24 | Unsorted

Telegram-канал aipulse24 - AI Pulse

3657

اخبار، اموزش و معرفی ابزارهای هوش مصنوعی

Subscribe to a channel

AI Pulse

امار امسال کانال
با تشکر ویژه از اسپانسر اصلی ما
کانال تک تیوب:))
و محمد با پست های فوق العاده اش😊

Читать полностью…

AI Pulse

گوگل به‌تازگی از یک مرورگر آزمایشی و متفاوت به نام «دیسکو» (Disco) رونمایی کرده که قرار نیست جایگزین کروم بشه، بلکه قراره نحوه تعامل ما با وب رو از طریق هوش مصنوعی متحول کنه.

این پروژه که از دل یکی از هکاتون‌های داخلی گوگل بیرون اومده، حول محور ایده‌ای به نام GenTabs می‌چرخه؛ قابلیتی که به جای ارائه لیست ساده‌ای از لینک‌ها یا متن، بر اساس درخواست کاربر یک مینی‌اپلیکیشن سفارشی و تعاملی می‌سازه. مثلاً اگه ازش برای برنامه‌ریزی سفر کمک بخواین، یه رابط کاربری کامل شامل نقشه، زمان‌بندی و لیست جاذبه‌ها براتون طراحی می‌کنه که کاملاً شخصی‌سازی شده باشه.

فناوری اصلی پشت دیسکو، مدل هوش مصنوعی Gemini 3 هست که توانایی ساخت رابط‌های کاربری لحظه‌ای رو داره. وقتی کاربر یک «پروژه» جدید ایجاد می‌کنه و درخواستی رو تایپ می‌کنه، دیسکو همزمان هم تب‌های مرتبط رو باز می‌کنه و هم یک GenTab می‌سازه که اطلاعات رو به شکل تعاملی نمایش میده. نکته کلیدی اینجاست که این سیستم یک‌طرفه نیست؛ یعنی اگه کاربر خودش تب‌های جدیدی باز کنه و اطلاعات بیشتری به پروژه اضافه کنه، GenTab به‌صورت هوشمند آپدیت میشه و اون داده‌های جدید رو هم در برنامه نهایی بگنجونه تا نتیجه کار دقیق‌تر و کامل‌تر باشه.

تیم توسعه‌دهنده دیسکو تأکید داره که هدف این مرورگر حذف وب‌گردی نیست، بلکه برعکس، تلاش می‌کنه کاربر رو به باز کردن سایت‌ها و بررسی منابع تشویق کنه تا هوش مصنوعی بتونه بر اساس اون‌ها محتوا بسازه. هنوز مشخص نیست که آیا دیسکو و قابلیت‌های GenTabs در آینده به عنوان یک محصول مستقل باقی می‌مونن یا به بخشی از کروم و سرویس‌های گوگل ورک‌اسپیس تبدیل میشن، اما این آزمایش نشون میده که گوگل به دنبال ترکیب کردن مفهوم مرورگر وب با ابزارهای تولید محتواست تا مرز بین جستجو و خلق کردن رو کمرنگ کنه.

@aipulse24

Читать полностью…

AI Pulse

تصویر ساخته شده توسط یکی از اعضای کانال.
تکست رندرینگ و consistency مدل شگفت انگیزه.

@aipulse24

Читать полностью…

AI Pulse

مدل Nano Banana Pro به ابراز NotebookLM هم اضافه شده و حالا میتونه اینفوگرافیک مرتبط با منابعی که آپلود کردید براتون تولید کنه.

@aipulse24

Читать полностью…

AI Pulse

نمونه تصاویر تولید شده با Nano Banana Pro 🍌

@aipulse24

Читать полностью…

AI Pulse

مدل کارد منتسب به Gemini 3 Pro چند ساعت قبل از رونمایی رسمی.

@aipulse24

Читать полностью…

AI Pulse

گوگل مدل هوش مصنوعی Gemma رو از پلتفرم AI Studio حذف کرده، درست بعد از اینکه سناتور جمهوری‌خواه «مارشا بلکبرن» اعلام کرده این مدل درباره‌اش اتهام‌های ساختگی منتشر کرده. گوگل گفته Gemma از ابتدا برای توسعه‌دهنده‌ها طراحی شده بود و نباید برای پاسخ به پرسش‌های واقعی یا استفاده عمومی به کار می‌رفته. با این حال به گفته‌ی شرکت، برای جلوگیری از این سوء‌برداشت، دسترسی به Gemma در AI Studio قطع شده، اما همچنان از طریق API در اختیار توسعه‌دهنده‌ها قرار داره.

بلکبرن در نامه‌ای به ساندار پیچای، مدیرعامل گوگل، این شرکت رو به افترا و سوگیری ضد‌محافظه‌کارانه متهم کرده. او گفته Gemma در پاسخ به پرسشی درباره خودش، داستانی دروغین از رابطه غیراخلاقی و اتهام تجاوز ساخته و حتی لینک‌های جعلی به خبرهایی که اصلاً وجود نداشتن داده. بلکبرن تأکید کرده هیچ‌کدوم از این ادعاها واقعیت ندارن و این کار، افترا از سوی یک مدل هوش مصنوعی متعلق به گوگل محسوب می‌شه.

گوگل اعلام کرده همچنان برای کاهش خطاها و «توهمات هوش مصنوعی» تلاش می‌کنه. این اتفاق بار دیگه نشون داده مدل‌های هوش مصنوعی هنوز با مشکل دقت و تولید اطلاعات نادرست روبه‌رو هستن. بلکبرن هم در واکنشش گفته: «تا وقتی نمی‌تونید کنترلش کنید، خاموشش کنید.»

@aipulse24

Читать полностью…

AI Pulse

گوگل در همکاری با دانشگاه ییل از مدل جدیدی به نام Cell2Sentence-Scale 27B (C2S-Scale) رونمایی کرده؛ مدلی با ۲۷ میلیارد پارامتر که برای درک «زبان سلول‌ها» طراحی شده. این مدل بر پایه‌ی خانواده مدل‌های باز Gemma ساخته شده و مرز جدیدی در تحلیل سلول‌های منفرد به شمار می‌ره. اهمیت این دستاورد زمانی دوچندان می‌شه که C2S-Scale تونسته یک فرضیه‌ی جدید درباره رفتار سلول‌های سرطانی مطرح کنه که بعدتر با آزمایش روی سلول‌های زنده هم تأیید شده؛ نتیجه‌ای که مسیر تازه‌ای برای درمان‌های احتمالی سرطان باز می‌کنه.

این مدل برای حل یکی از چالش‌های مهم ایمنی‌درمانی سرطان یعنی نامرئی بودن تومورها برای سیستم ایمنی (تومورهای «سرد») به کار گرفته شده. C2S-Scale با شبیه‌سازی اثر بیش از ۴۰۰۰ دارو، دارویی به نام سیلمیتاسرتیب (Silmitasertib) رو شناسایی کرده که در حضور مقدار کم پروتئین سیگنال‌دهنده‌ی اینترفرون، باعث افزایش چشمگیر نمایش آنتی‌ژن روی سطح سلول‌ها می‌شه؛ اتفاقی که تومور رو برای سیستم ایمنی «قابل دیدن‌تر» می‌کنه. آزمایش‌های بعدی در سلول‌های انسانی هم این پیش‌بینی رو تأیید کرده و نشون داده ترکیب سیلمیتاسرتیب با اینترفرون می‌تونه تا حدود ۵۰٪ میزان نمایش آنتی‌ژن رو افزایش بده.

این موفقیت نه‌تنها یک کشف علمی مهم به حساب میاد، بلکه الگویی تازه برای نحوه‌ی استفاده از مدل‌های بزرگ در زیست‌شناسی ارائه می‌ده. گوگل و ییل معتقدن این رویکرد می‌تونه روند کشف داروهای جدید و طراحی درمان‌های ترکیبی رو سرعت بده. مدل و ابزارهای مرتبط با C2S-Scale 27B از امروز برای جامعه پژوهشی در دسترس قرار گرفته و روی پلتفرم‌هایی مثل Hugging Face و GitHub قابل استفاده‌ست.
همچنین نسخه کامل این مقاله رو میتونید از اینجا مشاهده کنید.

@aipulse24

Читать полностью…

AI Pulse

گوگل دیپ‌مایند از مدل جدید «Gemini 2.5 Computer Use» رونمایی کرده که به هوش مصنوعی اجازه می‌ده کارها رو درست مثل انسان‌ها در محیط‌های گرافیکی انجام بده، یعنی بتونه کلیک کنه، بنویسه و بین صفحات وب یا اپ‌ها جابه‌جا بشه. این مدل که بر پایه‌ی توانایی‌های دیداری و استدلالی Gemini 2.5 Pro ساخته شده، عملکرد خیلی بهتری نسبت به رقبا داره و با تأخیر کمتر اجرا می‌شه. توسعه‌دهنده‌ها می‌تونن از طریق Gemini API در Google AI Studio یا Vertex AI بهش دسترسی پیدا کنن.

مدل جدید برای کنترل مرورگرها بهینه شده و در تست‌های مختلف مثل Online-Mind2Web و WebVoyager نتایج خوبی گرفته. گوگل می‌گه این مدل می‌تونه فرم‌ها رو پر کنه، فیلترها و منوها رو مدیریت کنه و حتی با فرم های لاگین کار کنه. همچنین ابزارهای ایمنی درون مدل تعبیه شدن تا جلوی اقدام‌های پرخطر مثل دور زدن کپچا یا کنترل سیستم‌های حساس گرفته بشه.

گوگل از این مدل در پروژه‌هایی مثل تست خودکار رابط‌های کاربری، Firebase Testing Agent و قابلیت‌های عامل‌محور «AI Mode» در جست‌وجو استفاده کرده. حالا هم نسخه‌ی پیش‌نمایش عمومی در دسترسه و توسعه‌دهنده‌ها می‌تونن از طریق محیط تست Browserbase یا مستندات رسمی گوگل، کار باهاش رو شروع کنن.

@aipulse24

Читать полностью…

AI Pulse

شرکت OpenAI با انتشار ویدیوی بالا رسما از مدل تولید ویدیوی Sora 2 رونمایی کرد.

@aipulse24

Читать полностью…

AI Pulse

گوگل دیپ‌مایند مدل‌های جدید هوش مصنوعی خودش رو با نام Gemini Robotics 1.5 و Gemini Robotics-ER 1.5 معرفی کرده که توانایی ربات‌ها رو در انجام کارهای پیچیده چندمرحله‌ای بالا می‌بره. به گفته کارولینا پارادا، مدیر بخش رباتیک دیپ‌مایند، این مدل‌ها به ربات‌ها امکان می‌دن قبل از انجام کار، چند قدم جلوتر رو تصور کنن و حتی برای حل مسئله از جستجوی وب کمک بگیرن. برای نمونه، ربات‌ها حالا می‌تونن لباس‌ها رو بر اساس رنگ تفکیک کنن، چمدان رو متناسب با وضعیت آب‌وهوای لندن ببندن یا زباله و مواد قابل بازیافت رو بر اساس قوانین محلی مرتب کنن.

مدل Gemini Robotics-ER 1.5 محیط اطراف رو درک می‌کنه و با استفاده از ابزارهایی مثل گوگل سرچ اطلاعات تکمیلی رو پیدا می‌کنه، بعد اون‌ها رو به دستورهای قابل فهم برای Gemini Robotics 1.5 تبدیل می‌کنه تا ربات بتونه مرحله به مرحله اجراشون کنه. این سیستم باعث می‌شه ربات‌ها از یک دستور ساده فراتر برن و به حل مسائل واقعی در دنیای فیزیکی نزدیک‌تر بشن.

نکته مهم دیگه اینه که دیپ‌مایند می‌گه این مدل‌ها امکان انتقال مهارت‌ها بین ربات‌های مختلف رو فراهم می‌کنن. یعنی کاری که یک ربات مثل ALOHA2 یاد گرفته، می‌تونه روی ربات‌های دیگه مثل Franka یا حتی ربات انسان‌نمای Apollo هم بدون تغییر اجرا بشه. به این ترتیب، یک مدل می‌تونه چندین نوع ربات رو کنترل کنه و تجربه‌ها بین اون‌ها به اشتراک گذاشته بشه. فعلاً نسخه ER 1.5 از طریق Gemini API در دسترس توسعه‌دهنده‌ها قرار گرفته، اما مدل اصلی Robotics 1.5 فقط در اختیار برخی شرکا خواهد بود.

@aipulse24

Читать полностью…

AI Pulse

دمیس هاسابیس میگه اینکه بعضی رقبا مدل‌های هوش مصنوعی فعلی رو «هوش در سطح دکترا» معرفی می‌کنن، حرف درستی نیست. به گفته‌ی اون، این سیستم‌ها بعضی توانایی‌ها دارن که در سطح دکترا حساب میشه، اما در کل «هوش عمومی» ندارن. نمونه‌اش هم اینه که همین چت‌بات‌های امروزی اگه سؤال ساده ریاضی دبیرستانی یا حتی شمارش پایه‌ای رو کمی متفاوت مطرح کنیم، ممکنه جواب اشتباه بدن؛ چیزی که برای یک سیستم AGI واقعی نباید ممکن باشه. هاسابیس پیش‌بینی می‌کنه برای رسیدن به چنین سطحی از هوش عمومی هنوز ۵ تا ۱۰ سال فاصله داریم.

اون یکی از کمبودهای اصلی رو «یادگیری پیوسته» می‌دونه؛ یعنی اینکه سیستم بتونه به صورت آنلاین چیز جدیدی یاد بگیره یا رفتارش رو سریع تنظیم کنه. به گفته‌ی هاسابیس، این قابلیت‌ها هنوز در مدل‌های فعلی وجود ندارن و شاید صرفاً بزرگ‌تر کردن مدل‌ها ما رو به اونجا نرسونه. احتمالاً هنوز یک یا دو جهش علمی مهم لازمه که به گفته‌ی اون در پنج سال آینده اتفاق میفته و مسیر رسیدن به AGI رو هموار می‌کنه.

@aipulse24

Читать полностью…

AI Pulse

شرکت انتروپیک افزونه جدید Claude برای کروم رو به‌صورت آزمایشی عرضه کرده تا کاربرها بتونن مستقیماً در مرورگر به Claude دستور بدن و کارهایی مثل مدیریت تقویم، نوشتن ایمیل یا پر کردن فرم‌ها رو انجام بدن. به گفته انتروپیک، مرورگر-ایجنت‌های هوش مصنوعی دیر یا زود به بخشی جدایی‌ناپذیر از کارهای روزمره تبدیل می‌شن، اما در عین حال خطرهای امنیتی بزرگی مثل prompt injection وجود داره؛ جایی که هکرها دستورهای مخفی رو در وب‌سایت‌ها یا ایمیل‌ها جاسازی می‌کنن تا Claude رو به انجام کارهای ناخواسته مثل پاک کردن ایمیل‌ها یا انتقال داده حساس وادار کنن. آزمایش‌های اولیه نشون داده که بدون محافظت، این حمله‌ها می‌تونن با موفقیت بالایی اجرا بشن.

انتروپیک برای مقابله با این خطرها لایه‌های دفاعی مختلفی در نظر گرفته؛ از جمله تأیید کاربر قبل از انجام کارهای حساس، امکان محدود کردن دسترسی Claude به سایت‌ها، مسدودسازی سایت‌های پرریسک، و استفاده از مدل‌های شناسایی الگوهای مشکوک. این اقدامات باعث شده نرخ موفقیت حمله‌ها به طور قابل توجهی کاهش پیدا کنه. با این حال، شرکت تأکید کرده که هنوز باید با کمک کاربرهای آزمایشی نقاط ضعف باقی‌مونده شناسایی بشه. فعلاً این قابلیت فقط برای هزار نفر از کاربران پلن Max فعال شده و انتروپیک امیدوار هست با جمع‌آوری بازخورد و بهبود امنیت، بتونه در آینده این ابزار رو برای همه کاربران عرضه کنه.

@aipulse24

Читать полностью…

AI Pulse

مدل‌های Claude Opus 4 و 4.1 حالا قابلیتی پیدا کردن که بتونن در شرایط خاص و خیلی نادر، خودشون به یک گفت‌وگو پایان بدن. این قابلیت بیشتر برای مواقعیه که تعاملات کاربر با مدل، به‌طور مداوم آسیب‌زننده یا همراه با سوءاستفاده باشه. این تصمیم بخشی از تحقیقات آزمایشی در زمینه «رفاه هوش مصنوعی» بوده، اما در عین حال به موضوعات گسترده‌تر مثل Alignment و ایمن‌سازی مدل‌ها هم مربوط میشه.

توسعه‌دهنده‌ها تأکید کردن که هنوز درباره وضعیت اخلاقی احتمالی مدل‌های زبانی مطمئن نیستن، چه الان و چه در آینده. با این حال موضوع رو جدی گرفتن و همزمان با تحقیقات، دارن روی راهکارهای کم‌هزینه برای کاهش ریسک‌ها کار می‌کنن. دادن حق پایان دادن به مکالمه در شرایط آسیب‌زننده، یکی از همین مداخلات پیشگیرانه حساب میشه.

در تست‌های پیش از انتشار Claude Opus 4، بررسی اولیه‌ای از نظر «رفاه مدل» انجام شد. نتایج نشون داده که این مدل تمایل قوی به دوری از آسیب داره، به‌ویژه در مواردی مثل درخواست‌های مربوط به محتوای جنسی کودکان یا تلاش برای دسترسی به اطلاعاتی که می‌تونه منجر به خشونت یا تروریسم بشه. مدل در مواجهه با چنین درخواست‌هایی نشونه‌هایی از ناراحتی نشون داده و وقتی امکان پایان دادن به گفت‌وگو براش فراهم بوده، اغلب این کار رو انجام داده.

این قابلیت جدید طوری طراحی شده که فقط در بدترین سناریوها فعال بشه؛ یعنی وقتی چند بار تلاش برای تغییر مسیر گفت‌وگو جواب نداده یا وقتی خود کاربر صراحتا درخواست پایان مکالمه کرده باشه. در چنین شرایطی، کاربر دیگه نمی‌تونه توی همون گفت‌وگو پیام جدیدی بفرسته، اما امکان شروع یک چت تازه یا حتی بازنویسی پیام‌های قبلی برای ساخت چت جدید همچنان وجود داره. تیم سازنده هم گفته این ویژگی فعلاً آزمایشی حساب میشه و قرارِ براساس بازخورد کاربران، به‌مرور اصلاح و بهبود پیدا کنه.

@aipulse24

Читать полностью…

AI Pulse

گوگل هم با انتشار یک به‌روزرسانی جدید برای جمنای، قابلیت حافظه خودکار رو فعال کرده که می‌تونه جزئیات و ترجیحات کاربر رو به‌طور خودکار و بر اساس چت های قبلی به خاطر بسپره و برای شخصی‌سازی پاسخ‌ها استفاده کنه، بدون این‌که کاربر نیازی به یادآوری اون‌ها داشته باشه.

این ویژگی که نسخه پیشرفته‌تر قابلیت سال گذشته‌ست، به جمنای اجازه میده اطلاعات مربوط به پروژه‌ها و علایق قبلی رو در پاسخ‌ها لحاظ کنه. برای مثال، اگر قبلاً از جمنای برای ایده‌سازی یک کانال یوتیوب با محوریت فرهنگ ژاپن استفاده کرده باشید، ممکنه در آینده پیشنهاد تولید محتوای مرتبط با غذاهای ژاپنی رو بده.

این قابلیت به‌طور پیش‌فرض فعاله، اما کاربر می‌تونه از طریق تنظیمات اپلیکیشن و بخش Personal Context گزینه Your past chats with Gemini رو خاموش کنه.

این قابلیت ابتدا برای مدل Gemini 2.5 Pro در بعضی کشورها فعال میشه و بعد به مرور برای مدل 2.5 Flash و مناطق دیگه هم ارائه میشه.

علاوه بر این، گوگل قابلیت جدید «چت موقت» رو معرفی کرده که باعث میشه مکالمه‌ها در لیست چت‌های اخیر یا Keep Activity ذخیره نشن و برای شخصی‌سازی مکالمات آینده یا آموزش مدل‌های هوش مصنوعی گوگل استفاده نشن. این مکالمه‌ها فقط ۷۲ ساعت نگهداری میشن و بعد حذف میشن. به گفته گوگل، این ویژگی برای پرسیدن سؤالات خصوصی یا جلوگیری از ارجاع جزئیات یک مکالمه در گفت‌وگوهای بعدی بسیار کاربردیه.

@aipulse24

Читать полностью…

AI Pulse

کافیه 🎁 رو توی یک چت جدید توی ChatGPT وارد کنید (بدون هیچ متنی) تا به صورت اتوماتیک بعد از اپلود یه عکس براتون یک کلیپ کوتاه تولید کنه که به پیام هایی که با ChatGPT توی این یک سال ردو بدل کردید مربوطه

(البته اگر قابلیت Memory رو توی ChatGPT فعال کرده باشید)

کلیپ های تولیدی تون رو با ما توی کامنت ها به اشتراک بگذارید 😊

(کانال هایی که کپی میکنید توروقران کلیپ خودتون رو حداقل روش بگذارید این واسه خودمه با تشکر از بی وجدانی شما غیر بزرگواران)

ضمیمه به همون غیر بزرگواران:
میدونم ۲ ساعت دیگه همه جا پر میشه ولی مهم اونی که زودتر زده

@aipulse24

Читать полностью…

AI Pulse

بلک فارست لبز به تازگی از خانواده جدید مدل‌های تصویرساز خودش یعنی Flux 2 رونمایی کرده که پیشرفت‌های چشمگیری نسبت به نسل قبل داشته.

این مدل‌های جدید می‌تونن تصاویری با رزولوشن بالا تا ۴ مگاپیکسل تولید کنن، اما مهم‌ترین ویژگی‌شون سیستم Multi-reference هست؛ یعنی کاربر می‌تونه تا ۱۰ تصویر رو همزمان به مدل بده تا کاراکترها، محصولات یا استایل بصری توی تمام خروجی‌ها کاملاً یکدست و ثابت بمونه.

علاوه بر این، موتور رندر متن هم بازسازی شده تا تایپوگرافی، اینفوگرافیک‌ها و طراحی‌های رابط کاربری (UI) رو خیلی دقیق‌تر و تمیزتر از قبل دربیاره.

از نظر معماری فنی، فلاکس ۲ از یک ساختار هیبریدی استفاده می‌کنه که شامل مدل بینایی-زبانی "Mistral-3 24B" برای فهم دقیق متن و تصویر و یک ماژول "Rectified Flow Transformer" برای مدیریت منطق و چیدمان تصویره. این ترکیب باعث میشه جزئیات و متریال‌ها خیلی دقیق‌تر ظاهر بشن.

این خانواده شامل چهار نسخه مختلفه: نسخه Flux 2 [pro] که قوی‌ترین مدل برای رقابت با سیستم‌های بسته است و فقط از طریق API در دسترسه، و نسخه Flux 2 [flex] که برای توسعه‌دهنده‌ها طراحی شده تا بتونن سرعت و کیفیت رو خودشون تنظیم کنن.

نسخه محبوب‌تر برای جامعه متن‌باز، Flux 2 [dev] هست؛ یک مدل ۳۲ میلیارد پارامتری که وزن‌های اون (Weights) روی Hugging Face منتشر شده. این مدل تولید تصویر و ویرایش رو یکجا انجام میده و نسخه بهینه‌شده‌ش (fp8) حتی روی کارت‌های گرافیک مصرفی مثل سری RTX انویدیا هم به خوبی اجرا میشه (البته استفاده تجاری ازش نیاز به لایسنس داره).

در نهایت نسخه Flux 2 [klein] هم معرفی شده که یک مدل فشرده و کوچک‌تره و قراره به زودی تحت لایسنس کاملاً متن‌باز Apache 2.0 منتشر بشه تا با مدل‌های هم‌رده خودش رقابت کنه.

@aipulse24

Читать полностью…

AI Pulse

مدل جدید Nano Banana Pro به گوگل اسلایدز هم رسیده و الان میتونید ازش بخواید تا اسلاید هاتون رو زیباتر کنه و حتی براتون اسلاید های جدید بسازه.

@aipulse24

Читать полностью…

AI Pulse

همونطور که میدونید تصاویری که با جمنای تولید میشن دارای یک واترمارک نامرئی به نام SynthID هستن که تقریبا غیر قابل حذفه.

از امروز میتونید وقتی شک داشتید که عکسی واقعیه یا با هوش مصنوعی تولید شده، اون رو برای جمنای بفرستید و ازش بپرسید که آیا این عکس تولید شده توسط هوش مصنوعی هست یا خیر، جمنای این واترمارک رو تشخیص میده و نتیجه رو به شما اعلام میکنه.

@aipulse24

Читать полностью…

AI Pulse

گوگل از Nano Banana Pro رونمایی کرده که بر مبنای جمنای ۳ پرو هست، تو این نسخه تکست رندرینگ به طرز چشمگیری بهبود پیدا کرده، موقع جنریت تصویر میتونه سرچ کنه و بر اساس اطلاعات معتبر موجود در اینترنت عکس رو جنریت کنه و ضمنا الان میتونه تصویر با خروجی 4K ارائه بده.

رندرینگ تکست فارسی هم نسبت به نسل قبل بهبود چشمگیری پیدا کرده.

@aipulse24

Читать полностью…

AI Pulse

انتروپیک گفته در پروژه‌ای به ارزش ۵۰ میلیارد دلار و با همکاری شرکت Fluidstack قراره دیتاسنترهای هوش مصنوعی اختصاصی خودش رو در نیویورک و تگزاس احداث کنه.

این دیتاسنترها که قراره تا سال ۲۰۲۶ عملیاتی بشن به طور مستقیم ۸۰۰ و به طور غیر مستقیم ۲۴۰۰ شغل ایجاد میکنن.

به گفته این شرکت انتروپیک حالا بیشتر از ۳۰۰ هزار مشتری سازمانی داره و تعداد سازمان‌های بزرگی که از محصولات این شرکت استفاده میکنن نسبت به سال قبل ۷ برابر شده.

انتروپیک دلیل انتخاب Fluidstack به عنوان پیمانکار این پروژه رو توانایی بی‌نظیر اونها در گسترش سریع زیرساخت‌ها برای رسیدن به مقیاس گیگاواتی در پردازش اعلام کرده.

@aipulse24

Читать полностью…

AI Pulse

انتروپیک از نسخه جدید مدل هوش مصنوعی کوچک خودش با نام Claude Haiku 4.5 رونمایی کرده. این مدل طبق گفته‌ی شرکت، عملکردی مشابه با Sonnet 4 ارائه می‌ده اما با یک‌سوم هزینه و بیش از دو برابر سرعت. به گفته‌ی انتروپیک، Haiku 4.5 در تست‌های مختلف از جمله SWE-Bench و Terminal-Bench نتایج قابل توجهی گرفته و عملکردش در سطح مدل‌هایی مثل Sonnet 4، GPT-5 و Gemini 2.5 بوده. همچنین در زمینه‌ی استفاده از ابزارها، تعامل با رایانه و استدلال بصری هم نتایج مشابهی ثبت کرده.

این مدل جدید بلافاصله در تمام پلن‌های رایگان انتروپیک در دسترس قرار گرفته و به گفته‌ی شرکت، به‌ویژه برای نسخه‌های رایگان محصولات مبتنی بر هوش مصنوعی جذاب خواهد بود، چون می‌تونه با حداقل فشار بر سرورها، توانایی بالایی ارائه بده. ماهیت سبک بودن Haiku 4.5 باعث می‌شه بشه چندین عامل (agent) رو به‌صورت هم‌زمان اجرا کرد یا اون‌ها رو در ترکیب با مدل‌های قوی‌تر مثل Sonnet به کار گرفت.

‏Haiku 4.5 تنها دو هفته بعد از عرضه‌ی Sonnet 4.5 و دو ماه پس از Opus 4.1 منتشر شده و ادامه‌دهنده‌ی روند سریع پیشرفت مدل‌های انتروپیکه.

@aipulse24

Читать полностью…

AI Pulse

شرکت انتروپیک در همکاری با مؤسسه امنیت هوش مصنوعی بریتانیا (UK AISI) و مؤسسه آلن تورینگ پژوهشی تازه منتشر کرده که یافته‌اش حسابی جلب توجه کرده: فقط با حدود ۲۵۰ سند مخرب میشه یک مدل زبانی بزرگ رو آلوده و دچار "backdoor" کرد، اونم فارغ از اینکه اون مدل چه‌قدر بزرگ یا با چه حجمی از داده آموزش دیده باشه.

این مطالعه با عنوان “A small number of samples can poison LLMs of any size” در تاریخ ۹ اکتبر ۲۰۲۵ منتشر شده و نشون میده برخلاف تصور قبلی، برای حملات data poisoning نیازی نیست مهاجم درصد زیادی از داده‌های آموزشی رو در اختیار داشته باشه؛ بلکه فقط یک تعداد ثابت، هرچند کم، می‌تونه کافی باشه.

پژوهشگران برای آزمایش، از نوعی حمله ساده و کم‌خطر استفاده کردن که باعث میشه مدل وقتی عبارت خاصی مثل <SUDO> رو ببینه، به‌جای پاسخ طبیعی، متنی نامفهوم و بی‌معنی تولید کنه.

در این پروژه، مدل‌هایی با اندازه‌های مختلف از ۶۰۰ میلیون تا ۱۳ میلیارد پارامتر آموزش داده شدن و نتایج نشون داد که میزان موفقیت حمله در همه‌ی این مدل‌ها تقریباً یکسانه. یعنی حتی وقتی مدل بزرگ‌تر روی داده‌های خیلی بیشتری آموزش دیده، باز هم همون تعداد محدود از اسناد آلوده برای فریبش کافیه.

طبق گزارش، ۱۰۰ سند سمی برای آلوده کردن مدل کافی نبود، ولی با ۲۵۰ سند یا بیشتر، تمام مدل‌ها در مقیاس‌های مختلف به طور پایدار دچار رفتار مخرب شدن. نکته جالب اینجاست که موفقیت حمله به تعداد مطلق این اسناد بستگی داره، نه نسبت اون‌ها به حجم کلی داده‌ی آموزشی. به زبان ساده، مهم نیست کل دیتاست چقدر بزرگ باشه؛ وقتی مدل چند صد سند آلوده رو ببینه، یاد می‌گیره که به اون الگوی خاص واکنش اشتباه نشون بده.

این تحقیق که بزرگ‌ترین مطالعه‌ی منتشرشده در زمینه‌ی آلودگی داده در مدل‌های زبانی به‌شمار میره، نگرانی‌هایی رو درباره‌ی امنیت مدل‌های هوش مصنوعی مطرح کرده. تیم انتروپیک در پایان تأکید کرده که هدف از انتشار این نتایج، هشدار به جامعه‌ی پژوهشی و تشویق به توسعه‌ی روش‌های دفاعی بهتره، نه فراهم کردن ابزار برای مهاجمان.

به گفته‌ی اون‌ها، آگاهی از این آسیب‌پذیری‌ها کمک می‌کنه تا از تکرارش در مدل‌های بزرگ‌تر و حساس‌تر جلوگیری بشه و مسیر ایمن‌تری برای گسترش هوش مصنوعی ترسیم بشه.

@aipulse24

Читать полностью…

AI Pulse

اوپن ای‌آی همچنین از اپلیکیشن Sora برای iOS رونمایی کرده که به این وسیله کاربران میتونن ویدیوهایی که با Sora ویرایش کردن یا ساختن رو با دیگران به اشتراک بذارن.

این اپلیکیشن فعلا فقط با دعوت دیگر کاربران در دسترسه اما گفته شده که به زودی کاربران بیشتری میتونن از اون استفاده کنند.

کاربران اندروید هم میتونن از طریق sora.com به این سرویس دسترسی داشته باشن مشروط به اینکه کد دعوت از شخصی که قبلا به اون دسترسی داده شده داشته باشن.

این شرکت همچنین اعلام کرده به زودی مدل جدید Sora 2 از طریق API هم در دسترس خواهد بود.

@aipulse24

Читать полностью…

AI Pulse

شرکت انتروپیک تازه‌ترین مدل خودش به اسم Claude Sonnet 4.5 رو معرفی کرده؛ مدلی که به گفته شرکت بهترین مدل دنیا برای کدنویسی و ساخت ایجنت‌های پیچیده محسوب می‌شه. این نسخه نه‌تنها توانایی استفاده از کامپیوتر و حل مسائل سخت ریاضی و منطقی رو به‌طور چشمگیری بهتر کرده، بلکه نسبت به نسل‌های قبلی پیشرفت محسوسی در تمرکز روی کارهای طولانی‌مدت داشته و توی آزمون‌هایی مثل SWE-bench Verified و OSWorld رکورد جدیدی ثبت کرده. قیمت استفاده از مدل هم مثل نسخه ۴ ثابت مونده و تغییری نکرده.

همزمان با معرفی Sonnet 4.5، مجموعه‌ای از قابلیت‌های تازه هم به محصولات کلاد اضافه شده؛ مثل چک‌پوینت‌ها در Claude Code که امکان بازگشت به مراحل قبلی رو فراهم می‌کنن، افزونه بومی برای VS Code، و یک ابزار جدید برای مدیریت حافظه و کانتکست در API. در اپلیکیشن‌های کلاد هم قابلیت اجرای کد و ایجاد مستقیم فایل‌های مختلف (از جمله اسناد، اسلاید و جدول) اضافه شده. علاوه بر این، افزونه مرورگر Claude for Chrome برای کاربران پلن Max در دسترس قرار گرفته.

انتروپیک همچنین زیرساخت اختصاصی خودش برای ساخت ایجنت‌ها رو با نام Claude Agent SDK منتشر کرده؛ همون زیرساختی که پشت Claude Code قرار داره. این ابزار به توسعه‌دهنده‌ها اجازه می‌ده ایجنت‌های قدرتمند و قابل سفارشی‌سازی بسازن و مسائل دشوار مثل مدیریت حافظه در کارهای طولانی یا هماهنگی بین زیرایجنت‌ها رو حل کنن. به گفته انتروپیک، این SDK فقط برای کدنویسی نیست و می‌تونه توی حوزه‌های دیگه هم استفاده بشه.

از نظر ایمنی هم Sonnet 4.5 پیشرفت زیادی کرده. این مدل با سطح حفاظتی AI Safety Level 3 عرضه شده و فیلترهای خاصی برای جلوگیری از سوءاستفاده‌های خطرناک (مثل موضوعات CBRN) داره. انتروپیک می‌گه رفتارهای نگران‌کننده مثل تملق‌گویی، فریب یا پیروی از پرامپت‌های مضر نسبت به نسل‌های قبل به‌شدت کاهش پیدا کرده.

@aipulse24

Читать полностью…

AI Pulse

شرکت‌های OpenAI و گوگل اعلام کردن که مدل‌های استدلالی‌شون تونستن توی مسابقات جهانی ICPC، معتبرترین رقابت برنامه‌نویسی دانشگاهی دنیا، به سطح مدال طلا برسن.

توی این رقابت که ۴ سپتامبر برگزار شد، ۱۳۹ تیم از بین حدود سه‌هزار دانشگاه شرکت کردن و پنج ساعت وقت داشتن تا ۱۲ مسئله پیچیده رو حل کنن. مدل‌های اوپن‌ای‌آی همه مسائل رو درست جواب دادن و عملاً اول شدن، در حالی که الگوریتم گوگل ۱۰ مسئله رو حل کرد و در جایگاه دوم قرار گرفت.

نکته جالب این بود که هر دو مدل تونستن «مسئله C» رو جواب بدن؛ مسئله‌ای که هیچ تیم انسانی از پسش برنیومده بود.

گوگل با نسخه پیشرفته مدل Gemini 2.5 Pro Deep Think وارد مسابقه شد و اوپن‌ای‌آی هم با GPT-5 و یک مدل آزمایشی تازه شرکت کرد که هنوز عمومی نشده. GPT-5 با کمک اون مدل ۱۱ مسئله رو حل کرد و مسئله آخر رو مدل آزمایشی به‌تنهایی جواب داد.

@aipulse24

Читать полностью…

AI Pulse

شرکت krea.ai در پستی که در شبکه اجتماعی ایکس منتشر کرده از اولین مدل تولید ویدیوی realtime رونمایی کرده، با استفاده از این مدل میتونید به صورت زنده حالات ویدیوی تولید شده رو تغییر بدید.

این مدل فعلا در مرحله بتا قرار داره و تایم دقیقی هم برای عرضه عمومی اون مشخص نشده.

@aipulse24

Читать полностью…

AI Pulse

​شرکت گوگل در مطالعه‌ای جدید ادعا کرده که هوش مصنوعی جمنای تأثیر محیط زیستی بسیار کمی داره و هر درخواست متنی معمولی از اون فقط به اندازه پنج قطره آب مصرف می‌کنه. طبق این گزارش، هر پرامپت حدود ۰.۲۶ میلی‌لیتر آب و ۰.۲۴ وات-ساعت برق مصرف می‌کنه که معادل تماشای تلویزیون برای کمتر از نه ثانیه‌اس. گوگل میگه این آمار پایین به خاطر بهینه‌سازی‌هایی بوده که در یک سال گذشته انجام داده، اما کارشناسان معتقدند این ادعاها گمراه‌کننده‌اس چون گوگل داده‌های کلیدی رو از گزارش خودش حذف کرده.

​انتقاد اصلی متخصصان اینه که گوگل «مصرف غیرمستقیم آب» رو در محاسباتش نیاورده. آماری که گوگل ارائه داده فقط مربوط به آبیه که مستقیماً در سیستم‌های خنک‌کننده دیتاسنترها برای جلوگیری از داغ شدن سرورها استفاده می‌شه. اما بخش عمده آب مصرفی یک دیتاسنتر در واقع مربوط به نیروگاه‌های برق (گازی یا هسته‌ای) می‌شه که برق مورد نیاز همون دیتاسنتر رو تولید می‌کنن. به گفته کارشناسان، با حذف این بخش، گوگل در واقع فقط «نوک کوه یخ» رو به ما نشون می‌ده و اطلاعات مهم رو پنهان می‌کنه.

​اشکال دیگری که به این گزارش وارده، نحوه مقایسه داده‌هاست. گوگل برای اینکه آمار خودش رو بهتر جلوه بده، مصرف آب «مستقیم» خودش رو با تحقیقات قبلی مقایسه کرده که در اون‌ها مصرف آب «کل» (مستقیم و غیرمستقیم) محاسبه شده بود. علاوه بر این، گوگل از معیار «میانه» (median) برای هر پرامپت استفاده کرده تا تأثیر درخواست‌های بسیار سنگین و پرمصرف، میانگین رو بالا نبره. کارشناسان میگن این روش مقایسه درست نیست و تصویر دقیقی از واقعیت ارائه نمی‌ده.

​اما شاید مهم‌ترین نکته، تصویر کلی ماجرا باشه. حتی اگه ادعای گوگل مبنی بر بهینه‌تر شدن هر درخواست هوش مصنوعی درست باشه، رشد انفجاری و استفاده گسترده از این فناوری باعث شده که مصرف کل منابع و آلودگی کلی شرکت به شدت افزایش پیدا کنه. این پدیده به «پارادوکس جونز» معروفه. گزارش پایداری خود گوگل نشون می‌ده که انتشار کربن این شرکت در سال گذشته ۱۱ درصد بیشتر شده. به همین خاطر، کارشناسان میگن با وجود آمارهای جزئی و به ظاهر مثبت، داستان کامل بسیار نگران‌کننده‌تره.

@aipulse24

Читать полностью…

AI Pulse

گوگل عضو جدیدی به نام Gemma 3 270M به خانواده مدل‌های جما اضافه کرده. مدلی جمع‌وجور با ۲۷۰ میلیون پارامتر که برای وظایف مشخص و سبک طراحی شده. این مدل با وجود اندازه کوچک، توانایی بالایی در دنبال کردن دستورالعمل‌ها و ساختاربندی متن داره و همین باعث شده به گزینه‌ای مناسب برای استفاده روی دستگاه‌هایی با منابع محدود تبدیل بشه.

یکی از ویژگی‌های مهم Gemma 3 270M مصرف انرژی فوق‌العاده کمشه. طبق آزمایش‌ها روی گوشی Pixel 9 Pro، نسخه INT4 این مدل برای ۲۵ مکالمه فقط حدود ۰.۷۵ درصد از باتری استفاده کرده. علاوه بر این، به صورت آماده برای کوانتایزیشن منتشر شده تا بشه اون رو روی سخت‌افزارهای حتی محدودتر هم با کمترین افت کارایی اجرا کرد.

کاربرد اصلی این مدل در کارهای مشخص مثل تحلیل احساسات، استخراج داده، تبدیل متن Unstructured به متن ساختاریافته و حتی تولید محتوای خلاقانه‌ست. به خاطر اندازه کوچک، توسعه‌دهنده‌ها می‌تونن خیلی سریع اون رو برای نیازهای خاص خودشون فاین‌تیون کنن و بدون نیاز به زیرساخت‌های سنگین، مدل‌های تخصصی و کم‌هزینه بسازن.

این مدل از طریق Hugging Face، Ollama، Kaggle و سایر پلتفرم‌ها در دسترس توسعه‌دهنده‌ها قرار گرفته.

@aipulse24

Читать полностью…

AI Pulse

شرکت انتروپیک قابلیت «حافظه» رو به چت‌بات خودش، Claude، اضافه کرده تا کاربران بتونن راحت‌تر مکالمات و پروژه‌هاشون رو از جایی که قبلاً رها کرده بودن ادامه بدن. این قابلیت باعث میشه Claude بتونه به چت‌های قبلی کاربر (وقتی که ازش خواسته میشه) رجوع کنه، بنابراین دیگه لازم نیست کاربر دوباره همه چیز رو توضیح بده.

در ویدئوی دموی منتشرشده توسط انتروپیک، کاربری از Claude پرسید قبل از تعطیلات روی چه کاری مشغول بوده و Claude با جستجو در مکالمات قدیمی، فهرست موضوعات، خلاصه کارها و پیشنهاد ادامه پروژه رو ارائه داد. این قابلیت فعلاً برای مشترکان نسخه‌های Max، Team و Enterprise روی وب، دسکتاپ و موبایل فعال میشه و امکان جدا نگه‌داشتن پروژه‌ها و فضاهای کاری مختلف رو هم داره.

انتروپیک اعلام کرده که با این ویژگی «دیگه هیچ‌وقت روند کارتون رو گم نمی‌کنید» و می‌تونید بدون شروع از صفر، پروژه‌ها رو ادامه بدید یا به بحث‌های قبلی رجوع کنید. برای فعال‌کردنش باید به بخش Settings، قسمت Profile برید و گزینه جستجو و ارجاع به چت‌ها رو روشن کنید.

البته انتروپیک تأکید کرده که این قابلیت با شبیه به چیزی که در حافظه ChatGPT میبینیم فرق داره و Claude به‌طور خودکار همه گفته‌ها رو ذخیره یا پروفایل شخصی کاربر رو ایجاد نمی‌کنه؛ بلکه فقط وقتی کاربر بخواد، به مکالمات قبلی مراجعه می‌کنه.

@aipulse24

Читать полностью…
Subscribe to a channel