Результати пошуку для "PRO"

Mac Studio запуск великомасштабних моделей: очікування від M3 Ultra, кластерного рішення та M5 Ultra

У квітні 2026 року вийшли одна за одною моделі рівня “трискладника” з обсягом 1 трлн параметрів, такі як DeepSeek V4 Pro, Kimi K2.6 тощо, і зробили так, що “запускати передові відкриті LLM на власних машинах” стало реальною опцією. Для інженерів і невеликих команд, які не хочуть будувати власні робочі станції на H100, але хочуть мати повноцінні можливості локального виведення, \\Mac Studio M3 Ultra 256GB\\ є наразі найбільш економічно вигідним рішенням “однією машиною”, а в поєднанні з кластеризацією через Thunderbolt 5 можна піднятися до діапазону 1T параметрів у масштабуванні. У цій статті зібрано експериментальні дані запуску M3 Ultra з великими моделями, кластерні рішення, переваги фреймворку MLX, а також очікувані строки виходу M5 Ultra. Наразі характеристики M3 Ultra: 256GB єдиної пам’яті, 819
ChainNewsAbmedia·04-27 11:14

DeepSeek V4 Pro на Ollama Cloud: Claude Code одним кліком

Згідно з твітом Ollama, DeepSeek V4 Pro було випущено 4/24, уже додано в каталог Ollama в режимі хмари, і лише однією командою можна викликати такі інструменти, як Claude Code, Hermes, OpenClaw, OpenCode, Codex тощо. В4 Pro1.6T params, 1M context, Mixture-of-Experts; хмарний висновок не завантажує локальні ваги. Щоб запускати локально, потрібно самостійно отримати ваги й виконувати їх з INT4/GGUF та кількома GPU. Ранні тести швидкості були впливом хмарного навантаження: у звичайному режимі приблизно 30 tok/s, у піку 1.1tok/s; рекомендується спочатку використовувати хмарний прототип, а для офіційного серійного виробництва — виконувати власний висновок або використовувати комерційне API.
ChainNewsAbmedia·04-27 06:34

Хмарне середовище Tencent Cloud QClaw інтегрує фреймворк Hermes, підтримує перемикання між кількома моделями, зокрема DeepSeek-V4 Pro

Згідно з офіційним оголошенням Tencent Cloud від 27 квітня, настільний інструмент QClaw для AI-агентів Tencent Cloud офіційно випущено у версії v0.2.14. Tencent Cloud заявила, що це найбільше за масштабом оновлення QClaw за весь час; ключові оновлення включають підключення фреймворку Hermes Agent, оновлення базової моделі до режиму вільного перемикання, а також повне оновлення «Інспіраційної площі» до «Площі експертів».
MarketWhisper·04-27 05:26
news-image

DeepSeek V4-Flash піднявся на Ollama Cloud, сервери США: Claude Code, OpenClaw — однокнопкове підключення

Ollama Cloud щойно додав у каталог DeepSeek V4-Flash; виведення виконується на хостингах у США, пропонує три набори команд в один клік для підключення Claude Code, OpenClaw і Hermes. V4-Flash/V4-Pro використовують архітектуру MoE, нативно підтримують 1M контекст і знижують витрати завдяки стисненню Token-wise + розрідженій увазі DSA; за сценарію 1M FLOPs на один token зменшується на 27%, а KV кеш — на 10%. API сумісний з OpenAI ChatCompletions та Anthropic, що робить зручним перемикання між різними робочими процесами та знижує витрати й ризики щодо даних і суверенітету.
ChainNewsAbmedia·04-24 10:45

DeepSeek запустила V4 відкриту прев’ю-версію, технічний рейтинг 3206 перевершив GPT-5.4

DeepSeek 24 квітня офіційно випустив серію прев’ю-версій V4, відкривши її як open source за ліцензією MIT; ваги моделей уже синхронно завантажено на Hugging Face та ModelScope. Згідно з технічним звітом DeepSeek V4, V4-Pro-Max (найпотужніший режим інференсу) на бенчмарку Codeforces набрав 3206 балів, перевершивши GPT-5.4.
MarketWhisper·04-24 05:38
news-image

OpenAI 推 GPT-5.5:12M контекст, AA індекс на першому місці, Terminal-Bench 82.7% переписує агентський бенчмарк

OpenAI опублікувала GPT-5.5, з акцентом на агентську роботу та обробку корпоративних знань, і одночасно запустила її в ChatGPT та Codex. Основні моменти: контекстне вікно 1200 млн token, AA Intelligence Index 60, випередження Claude Opus 4.7, Gemini 3.1 Pro; ціна становить 5 доларів за кожен мільйон token на вхід і 30 доларів на вихід, кількість вихідних token зменшується приблизно на 40%, а фактична вартість зростає приблизно на 20%.
ChainNewsAbmedia·04-23 19:45

Claude Code скасовує виведення Pro-пакету, щоб його використовувати, потрібно оформити підписку Max! Керівники Anthropic заявляють, що це ще тестується

Нещодавно кілька користувачів помітили, що, ймовірно, на офіційному сайті Anthropic Claude Code з Pro (20 доларів/місяць) прибрали та замінили на Max (від 100 доларів/місяць) для використання. Офіційно заявили, що це лише тест для приблизно 2% нових реєстрацій prosumer, і наявні користувачі Pro та Max не постраждають. Цей крок розцінюють як повторну оцінку витрат і цінової стратегії для високовитратних функцій; у майбутньому, можливо, такі функції відокремлять від масових пропозицій і перейдуть до багаторівневого ціноутворення з вищими тарифами.
ChainNewsAbmedia·04-22 04:34

Google запускає Deep Research Max: підтримка MCP, можливість підключення до корпоративних приватних даних

Згідно з офіційним оголошенням у блозі Google DeepMind, Google 21 квітня 2026 року запустила нове покоління автономних дослідницьких агентів Deep Research і Deep Research Max, побудованих на Gemini 3.1 Pro, як офіційну версію після preview-версії, яку в грудні 2025 року було надано через Interactions API. Наразі обидва агенти доступні у формі public preview у платних тарифах Gemini API, і Google Cloud стартапи та корпоративні користувачі згодом отримають доступ. Однакові назви, але різне позиціонування варіантів: інтерактивні vs асинхронні глибокі дослідження Google розділяє ці два агенти за сценаріями використання: Deep Research
ChainNewsAbmedia·04-21 18:14

Live Artifacts від Claude: панель приладів безпосередньо підключає застосунок для миттєвого автоматичного оновлення

Згідно з офіційним оголошенням X від Claude, Anthropic 20 квітня в застосунку Claude для робочого столу Cowork запустила функцію Live Artifacts, яка дозволяє графікам, панелям і трекерам, згенерованим ШІ, напряму підключатися до програм і файлів користувача та автоматично оновлюватися найсвіжішими даними під час відкриття. Live Artifacts доступна всім користувачам Cowork у платних тарифних планах Claude (Pro, Max, Team, Enterprise). Ключові можливості Live Artifacts: від статичних результатів до миттєвого взаємозв’язку Раніше після створення Claude Artifacts виникав відрив від реальності — якщо користувачу потрібно було оновити дані, доводилося знову вставляти їх і просити Claude згенерувати нову версію. L
ChainNewsAbmedia·04-21 07:45

Чи є шанс обійти правила Комісії з фінансового нагляду щодо купівлі криптовалюти через оплату карткою? Одінтінь пропонує сервіс купівлі криптовалюти Wallet Pro за американською дебетовою карткою для підписки

Сервіси OwlPay і Wallet Pro, представлені компанією OdinTin, використовують технологію стейблкоїнів для здійснення B2B транскордонних платежів і, співпрацюючи з міжнародними платіжними гігантами, демонструють свої амбіції щодо розширення в сфері фінансових технологій. Здійснюючи операції з-за кордону, OdinTin обминає обмеження регуляторного нагляду на Тайвані, пропонуючи швидкі угоди з віртуальними активами, а також, попри новий закон про послуги з віртуальними активами, у майбутньому може стати для інших іноземних компаній у якості зразка для виходу на ринок Тайваню.
USDC0,01%
CryptoCity·04-15 10:59