NVIDIA CompileIQが挑むGPU性能を左右するコンパイラ最適化の自動設計
NVIDIAは2026年5月、GPUカーネルの性能を引き出すコンパイラ最適化を自動化するツール「CompileIQ」を発表した。これは、特定のGPUワークロードに対して最適なコンパイラフラグの
読む →AIインフラを理解するための重要テーマ。
AIインフラを理解するための重要テーマ。
AIインフラを理解するための重要テーマ。
AIインフラを理解するための重要テーマ。
Latest Articles
NVIDIAは2026年5月、GPUカーネルの性能を引き出すコンパイラ最適化を自動化するツール「CompileIQ」を発表した。これは、特定のGPUワークロードに対して最適なコンパイラフラグの
読む →
NVIDIAはKubernetes環境での推論ワークロード起動を0.8秒以下に短縮する新機能「Dynamo Snapshot」を公開した。この発表が重要なのは、単なる技術改善ではなく、AI推論
読む →
NVIDIAがGB200 NVL72向けにSlurmのトポロジー認識スケジューリング機能を統合し、エクサスケール級のAI基盤で計算効率を最大限に引き出す設計手法を公開した。GPUの物理的配置を
読む →
ゲーム開発におけるAI実装が、単なるグラフィックス向上から言語理解と推論を備えた自律的キャラクター生成へと移行し始めた。NVIDIAは2026年5月、ゲーム開発者向けRTX技術の最新展開として
読む →
NVIDIAは2026年3月、Kubernetesクラスタ全体のGPU使用率をリアルタイムで可視化する監視機能を発表した。対象は同社のGPUオペレーターとDCGMエクスポーターを導入済みの環境
読む →
金融取引に大規模言語モデルを導入する動きが加速する中、NVIDIAは2026年3月、金融分野に特化したSTAC-AIベンチマークにおいて、Blackwellアーキテクチャ搭載GPUが大規模言語
読む →
NVIDIAは2026年5月、プロフェッショナル向けGPU「NVIDIA RTX PRO 4500 Blackwell」を発表し、ゲノム解析とタンパク質折り畳み計算において従来比最大2倍の性能
読む →
NVIDIAは2026年5月、並列コンピューティングプラットフォームの最新版「CUDA 13.3」を公開した。このリリースの本質は、C++へのタイルプログラミング導入、コンパイラ自動最適化、P
読む →
NVIDIAが2025年11月に公開したCUDA Tileプログラミング機能は、既存の大規模C++コードベースにタイルベース演算を直接組み込める設計である。これによりGPUカーネルの最適化手法
読む →ComfyUIの最新バージョン0.21.0が公開された。このアップデートの核心は、画像生成ツールとして確固たる地位を築いてきたComfyUIが、動画、音声、そして3Dモデルという異なるモダリテ
読む →Open WebUIのバージョン0.9.3公開は、単なる機能追加ではない。これはAI推論を支えるユーザーインターフェース層が、クラウドGPUの利用効率と運用コストに直接介入し始めたことを示すシ
読む →llama.cppのGitHubリポジトリに提出されたプルリクエスト 22522は、NVIDIA Hopperアーキテクチャ以降のGPUで動作する大規模言語モデルの推論効率を根本から刷新する取
読む →
GTC Taipei at COMPUTEXにおいて、NVIDIAは次世代AI戦略の全容を開示した。本会議の中核にあるのは、従来のデータセンターを超える「AIファクトリー」概念の具体化と、ソフ
読む →
独立系ハードウェア検証メディアPhoronixが4月9日に公表した初期的ベンチマークによると、NVIDIAの新型サーバーCPU「Vera」は全コア稼働時の性能維持とメモリ帯域幅において、x86
読む →
AI基盤の投資判断が、モデル性能からトークンあたりの電力効率へと急速にシフトしている。NVIDIAやAMDが提供するGPU群を中核に、データセンター全体をリアルタイム推論装置とみなす設計思想が
読む →
AI産業の供給網において、半導体設計の知財を握る英Armの動きが無視できない段階に入っている。同社がAI半導体の自社開発へ本格参入するというロイターの報道は、単なる新規事業の発表を超え、NVI
読む →
AI産業は2022年以降、生成AIの普及とともに前例のない投資拡大期を経験してきた。しかし、SemianalysisとAltimeter Capitalの分析が示すように、いま業界は単なるモデ
読む →
2025年に向けたAIの進化を語るうえで、ネットワーク技術ほど静かで深刻な障壁はない。エヌビディアが開示した最新のロードマップ資料によると、次世代GPUアーキテクチャBlackwellの後継と
読む →
AIの急速な普及に伴い、各国政府がデータの物理的保管場所と管轄権を厳格化する動きが広がっている。2024年、OracleはEUの「EU Sovereign Cloud」構想に数十億ドル規模の投
読む →
CoreWeaveがGoogle Cloudとの接続サービス「CoreWeave Interconnect」を発表した。両社間の専用線でAIワークロードを統合し、分散したGPUリソースを一体的
読む →
空行 NVIDIAは3月28日、AIエージェント専用に設計した初のCPU「Vera」を、Anthropic、OpenAI、SpaceXAIの3研究所とOracle Cloud Infrastr
読む →
AI経済新聞の編集デスクとして、今回の発表が示すのは単なる単一事業者の業績報告ではない。むしろAI産業における「モデル推論」需要の爆発が、クラウドインフラストラクチャーとGPU調達の地殻をどう
読む →
生成AI向けGPUクラウド事業を展開するCoreWeaveは2025年3月3日、米国証券取引委員会に新規株式公開のための登録届出書を提出した。Nasdaq市場にティッカーシンボルCRWVでクラ
読む →
AIインフラ企業CoreWeaveが英国で2拠点のデータセンター稼働を開始した。NVIDIA H200 GPUとQuantum-2 InfiniBandで構成され、総投資額は10億ポンドに達す
読む →
生成AIの学習と推論を支える物理インフラの分業が加速している。AI専業クラウド事業者CoreWeaveは、全施設でNVIDIA Quantum-2 InfiniBandネットワークと直接液冷を
読む →
AI半導体の新興企業Groqは2025年3月、Nvidiaと非独占的な推論技術ライセンス契約を締結したと発表した。GroqがNvidiaの推論関連特許へアクセスし、自社のLPU(Languag
読む →
OpenAIはDell Technologiesとの提携により、法人向けAIコーディング支援「Codex」をハイブリッド環境やオンプレミス環境へ本格展開する。両社の発表資料によると、Dellの
読む →
CoreWeaveがNVIDIA HGX B300の大規模提供を開始した。GPUクラウド事業者による専有契約型インスタンスの拡充は、エージェントAIが求める推論基盤の供給不足が依然として解消さ
読む →
AIインフラの膨張が金属資源の調達構造に地殻変動を起こしている。米国国立標準技術研究所(NIST)が公表した最新の報告書は、金属加工の持続可能性と強靱性を高める戦略を体系的に提示し、これが米国
読む →llama.cppの最新ビルドb9197で、VulkanバックエンドにBF16からFP32への変換パイプラインが追加された。これにより、Brain Floating Point形式で量子化され
読む →llama.cppのビルドb9247が公開され、Apple Silicon向けMetalバックエンドのパディング処理とコピー処理に最適化が施された。今回の変更は、GPU上でのテンソル操作におけ
読む →オープンソースのLLM推論フレームワーク「llama.cpp」がビルド番号b9295を公開した。一見するとVulkan向けSPIRV-HeadersのWindows環境における検出修正という小
読む →
マイクロソフトのAI戦略は、Azureクラウド基盤とCopilotスタックを軸に、エンタープライズ領域で静かな浸透を続けている。直近の公式発表では、玩具メーカーのマテル、化学大手のダウ、メディ
読む →
CoreWeaveはNVIDIA HGX B200ベースのインスタンスを一般提供に移行した。Blackwellアーキテクチャを搭載したこのGPUサーバー群が特定顧客向けの限定的供給を脱し、不特
読む →
CoreWeaveは2025年3月、NVIDIA GB200 NVL72システムの大規模稼働を開始したと発表した。顧客としてIBM、Cohere、Mistral AIの名前が明示され、単なる技
読む →
Mistral AIとCoreWeaveの提携発表は、AI開発におけるGPU調達手法の構造変化を示す象徴的な事例である。両社はNVIDIA GTCの場で関係深化を公表し、CoreWeaveの特
読む →
AIの産業基盤を支える半導体技術に対し、米国商務省の標準技術研究所NISTが新たな公募を発表した。CHIPS for America計画の一環として、マイクロエレクトロニクスの重要研究から試作
読む →NVIDIAが公開した拡散モデルベースの動画生成モデルCosmos Predict 2.5に対し、パラメータ効率の高いファインチューニング手法LoRAおよびDoRAを適用し、ロボット操作動画の
読む →
CoreWeaveがNVIDIAの新たな認証プログラムにおいて、大規模言語モデルの学習だけでなく推論ワークロードでも最上位の検証を取得した。この発表は一見すると単なる技術認証のニュースだが、実
読む →
シンガポール政府とOpenAIの間で結ばれた複数年にわたるパートナーシップは、単なる製品導入の発表ではない。国家がAIの供給網において「最大の法人顧客」から「共同開発主体」へと役割を変える、そ
読む →
AI産業の収益構造が根本から塗り替わろうとしている。Broadcomの2025年度第1四半期決算は、AI向け半導体需要がGPUの枠を超え、カスタムチップへと重心を移しつつある実態を浮き彫りにし
読む →
この記事は、AIの進展が創出した産業構造を、NVIDIAのハードウェア計画やクラウド事業者の投資動向という物理的供給網から読み解くものである。企業のデジタル変革需要が、GPUサプライチェーン全
読む →
AI人材の育成領域が、単なるオンライン講座の集合から巨大テクノロジー企業によるインフラ囲い込み戦略へと変質している。2025年、エヌビディアとAWSが主導する教育イニシアチブは、次世代開発者の
読む →
米国政府によるAI調達ルールの大幅な見直しが、クラウド3大巨頭からGPUメーカー、さらにはAIチップ設計を手がけるスタートアップに至るまで、産業ピラミッド全体の収益構成を静かに塗り替えようとし
読む →
インドの決済プラットフォームPaytmが、米国のAI推論専用プロセッサ企業Groqとの提携を発表した。この発表で注目すべきは、単なる企業間契約ではない。決済と金融サービスのリアルタイム性をAI
読む →
生成AI産業への資金流入が止まらない中、xAIが発表したリーダーシップ交代は、単なる人事異動を超えて、AI開発企業における経営と技術の分業モデルが明確に進化した瞬間である。イーロン・マスクが会
読む →
AIチップ市場の勢力図が推論領域で揺らいでいる。AMDは2025年第1四半期のデータセンター売上高が前年同期比68%増の約38億ドルに達したと発表し、その過半をMI300Xシリーズが占めた。こ
読む →
2025年第1四半期のソフトウェア企業決算では、AIへの支出が前年同期比3.8倍に急拡大した。この数字は単なる成長率ではなく、IT予算の構造が汎用ソフトウェアから推論処理とGPU基盤へと再配分
読む →
イーロン・マスク率いるxAIが、同社の大規模言語モデルGrok向けに音声対話を可能にするVoice Agent APIの提供を開始した。この発表は単なる機能追加ではなく、会話型AIがクラウドイ
読む →
2025年度の連邦政府による中小企業イノベーション研究プログラムで、米国標準技術局が半導体や量子計算と並んで人工知能領域の8社を選定した。この発表は単なる補助金交付にとどまらず、AI産業におけ
読む →
Googleが年次開発者会議Google I/O 2026で100項目に及ぶ発表を行った。この数字自体が、同社のAI戦略が単独製品の改善ではなく、半導体からアプリケーション層までを垂直統合する
読む →
量子センシング技術の新しいノイズ制御手法が、NISTの研究チームによって発表された。これはAI産業の根幹をなす半導体製造の限界を引き上げる可能性を持つ。量子効果が支配的なナノメートルスケールで
読む →推論エンジンvLLMの最新パッチがリリースされた。v0.20.2ではDeepSeek V4やQwen3-VLといった先端モデル固有のバグ修正が集中しており、AI推論基盤レイヤーがモデル特化型の
読む →Googleの最新オープンモデルGemma 4シリーズが、エッジAI推論フレームワークのデファクトスタンダードであるllama.cppに正式対応した。このマージにより、コンシューマGPUやCP
読む →
クラウドゲーミング大手GeForce NOWが、映画『007』シリーズ最新作のゲーム版と月額サービスを抱き合わせた「007 First Light Ultimate Membership Bu
読む →
119億ドル規模のAIインフラ契約が、クラウド業界の勢力図を塗り替えようとしている。CoreWeaveはOpenAIに対し、大規模言語モデルの訓練に必要な計算資源を長期供給すると発表した。同時
読む →
イーロン・マスクが率いるxAIは2025年4月、エルサルバドル政府との間で世界初となる全国規模のAI教育プログラムを開始した。全人口約630万人を対象とするこの取り組みは、単なる教育支援ではな
読む →
Googleの親会社Alphabetは2025年4月、ミズーリ州における新たなコミュニティ投資計画を発表した。同社の公式発表によると、カンザスシティ地域に新設予定のデータセンターに関連し、州全
読む →
誰もが日常的に使う検索エンジンに、大規模言語モデルが本格的に組み込まれる動きが加速している。この変化の核心にあるのは、単なる機能追加ではない。情報へのアクセス手段が変わることで、広告、クラウド
読む →
マイクロソフトの最高技術責任者ケビン・スコットが公式ブログで公開した対談で、現在のAI開発を8つの技術レイヤーに分解し、各層の相互依存関係を詳細に語った。注目すべきは、単一のモデルやアプリケー
読む →
AI向けGPUクラウド事業を中核とするCoreWeaveが、Nasdaq市場への新規株式公開の条件を公表した。1株あたりの公募価格は40ドル、発行するのは既存株主を含めて3750万株で、調達額
読む →
エンタープライズ向けGPUクラウド大手CoreWeaveがエージェント型AIワークロード専用の安全な隔離実行環境「CoreWeave Sandboxes」を発表した。強化学習、AIエージェント
読む →ローカルLLM実行環境のOllamaがバージョン0.24でOpenAIのCodex Appを正式サポートした。これは単なる機能追加ではなく、クラウド依存の開発スタイルをローカルへ引き戻す構造変
読む →
マイクロソフトが提供するAI搭載ドローンが、絶滅の危機に瀕するマウイイルカの生態調査に投入された。これは単なる環境保護の美談ではなく、エッジコンピューティングとクラウドAIが野生生物保護という
読む →
AI専用チップを開発するGroqが6.4億ドルのシリーズDラウンドを完了した。今回の資金調達はBlackRockが主導し、Cisco InvestmentsやSamsung Catalyst
読む →
NIST(米国立標準技術研究所)の研究チームが、宇宙空間や原子炉内部といった極限環境で動作するフォトニックチップの実装技術を開発した。AI産業にとって本質的に重要なのは、この封止技術がシリコン
読む →
NVIDIAは社内の研究開発プロセスに、大規模言語モデルCodexとGPT-5.5を組み合わせた独自の開発支援システムを本格導入した。研究成果を実証可能なプロトタイプへ短時間で落とし込む仕組み
読む →Ollamaのバージョン0.23.4公開は、一見すると軽微なパッチリリースに見える。しかし、ollama自身がOpenCodeという対話型コード生成ツールを起動する際にビジョンモデルと画像入力
読む →
自動車の車室内体験は、ルールベースの操作系から推論と計画を備えたマルチモーダルAIシステムへ移行しつつある。NVIDIAは2026年5月、この転換を加速させるクラウドから車載までの一貫開発フレ
読む →
大規模言語モデルを事業に組み込む企業にとって、推論処理の速度とコストは契約更新のたびに重みを増す要素である。今回CoreWeaveがNVIDIA GB200 NVL72ラックスケールシステムを
読む →AIエージェントの本格展開を支える推論基盤として、NVIDIAの次世代GPU「HGX B300」と特化型クラウドプロバイダーCoreWeaveの組み合わせが、業界の新たな参照モデルになりつつあ
読む →
地下資源開発を担うエンジニアリング企業は、NVIDIAのエージェントAI基盤によって従来の解析ワークフローを抜本的に再構築しつつある。これは単なる自動化ではなく、物理シミュレーションと大規模言
読む →
NVIDIAが発表したGPUカーネル自動翻訳の実証実験は、AIエージェントがハードウェア最適化の専門知識を代替し始めた転換点である。同社の研究チームは、Python向けcuTileで記述された
読む →llama.cppの開発チームはビルドb9251において、マルチモーダルモデル向けのパラメータ適合処理fit_paramsに、画像投影層mmprojの構成を反映させる変更を加えた。この更新の本
読む →llama.cppのビルドb9275は、Apple Silicon GPU向けの低レベル演算カーネルを刷新し、モバイルおよびエッジ環境での大規模言語モデル実行効率に具体的な改善をもたらした。今
読む →llama.cppの最新ビルドb9294で、QualcommのAdreno GPU向けにMixture of Expertsモデルの推論カーネルが汎用化された。この変更はモバイルデバイス上で大
読む →生成AIの推論基盤であるllama.cppが新ビルドb9318を公開した。今回の更新で特に注目されるのは、ドラフトモデルを用いた高速推論手法である投機的デコーディングの内部構造に、マルチスレッ
読む →オープンソースの大規模言語モデル推論エンジン「llama.cpp」が、ビルド番号b9333をリリースした。今回の更新で最も注目すべき点は、単なるバグ修正や性能向上ではなく、AppleデバイスI
読む →ソフトウェア開発者でなくとも、このビルド番号が放つ産業上の意味は大きい。GitHub上のオープンソースプロジェクト「llama.cpp」がリリースしたビルドb9351は、大規模言語モデルの推論
読む →llama.cppプロジェクトがビルドb9357を公開した。このリリースの核心は、AMDのUMA(Unified Memory Architecture)を採用するGPU向けに、Vulkanバ
読む →
AIエージェントがLinuxのシェル操作を自律実行する際、Bashコマンドの正確な生成は実用化の核心課題である。NVIDIAは2026年1月、小規模言語モデルに文法制約付きデコードを適用し、B
読む →
NVIDIAが企業向けAI基盤の標準設計図を公開した背景には、エージェントAI時代のデータセンター需要と供給制約の深刻なギャップがある。この参照アーキテクチャの発表は、GPU調達から本番運用ま
読む →
物流AI市場が2028年までに年平均41.7%成長し655億ドル規模に達するというAllied Market Researchの試算を背景に、NVIDIAは2025年4月、意思決定支援エージェ
読む →
エッジAIの計算資源制約を打破する技術が、産業用ロボットや自律機械の現場に浸透し始めている。NVIDIAの組み込み向けモジュール「Jetson」シリーズにおいて、限られたメモリ容量でより大規模
読む →
自律的に判断し行動するエージェントAIの実用化には、従来の計算機設計では解決できない「推論の非決定性」という根本課題が横たわっている。NVIDIAが2026年3月に発表した次世代GPUプラット
読む →
OpenAIの推論特化型モデルが1940年代から未解決だった離散幾何学の単位距離問題に解答を示し、長年の主要予想を反証した。数学の証明をAIが生成した事例そのものより、この成果がGPU基盤と推
読む →
CoreWeaveがスウェーデンのデータセンター運営企業EcoDataCenterと手を組み、欧州では初期事例となる大規模NVIDIA Blackwellクラスタを同国ファールンに整備した。G
読む →
AIモデル開発の主戦場が学習から推論へ移行するなか、GPUクラウド事業者CoreWeaveがGTC 2026で公開した本番環境の実装例は、インフラ供給網の再編を読み解く格好の材料である。同社は
読む →
CoreWeaveはIBMのGraniteモデル向けに、NVIDIA GB200 NVL72システムを中核としたAIスーパーコンピュータを構築すると発表した。この契約でIBMは、自社開発の大規
読む →
AI向けクラウド基盤のCoreWeaveが、NVIDIA GB200 NVL72とGB300 NVL72を用いたMLPerf 6.0の推論ベンチマークでDeepSeek R1モデルを動作させ、
読む →
CoreWeaveがNVIDIA GB200 NVL72インスタンスの一般提供をクラウド事業者として初めて開始した。これは単なる新製品のリリースではない。AI向けコンピューティングの供給構造そ
読む →2025年5月、C++製の大規模言語モデル推論エンジン「llama.cpp」が動画ファイルの直接入力に対応した。これまでテキストと静止画に限られていたローカル推論の対象が、映像という時間軸デー
読む →プログラムのビルドにかかる時間が数秒短縮される。ソフトウェア開発の現場では些細な変更と見なされがちだが、大規模言語モデルの推論エンジンにおいては、この改良が開発者コミュニティ全体の反復速度を底
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」のGitHubリポジトリにおいて、エッジAIプラットフォームを手がけるHexagonがFlash Attentionのs
読む →
CoreWeaveは2025年5月、NVIDIA RTX PRO 6000 Blackwell Server Editionを搭載したクラウドインスタンスの一般提供を開始した。これは従来のGP
読む →
AI向けクラウドサービスを展開するCoreWeaveは2025年4月1日、NVIDIAのクラウドサービスプロバイダーパートナープログラムへの参加を正式に発表した。この認定は、NVIDIA製GP
読む →
CiscoがAI特化型クラウド事業者CoreWeaveの二次株式売却に投資家として参加し、6億5000万ドル相当の株式を取得した。この取引は単なる資金調達ではなく、ネットワーク機器大手がGPU
読む →
米国証券取引委員会は2024年、上場企業が四半期報告書を半期報告書に置き換えることを選択制で認める規則改正案を公表した。対象はすべての登録企業であり、AI関連企業を含むテクノロジー銘柄の情報開
読む →
2025年4月、xAIはAPIを通じてGrok 3のビジネス利用を公式に解禁した。新設されたGrok BusinessとGrok Enterpriseの2プランは、単なるAIチャットボットの法
読む →
イーロン・マスク率いるxAIの対話型AI「Grok」がサウジアラビアで正式サービスを開始した。これは単なる海外展開の一報ではない。米国と中国に集中する大規模言語モデル開発の軸が中東に伸び、推論
読む →
xAIは2025年4月9日、Grokシリーズに音声認識と音声合成のAPIを追加した。チャットボット市場ではOpenAIとAnthropicの音声対話が既に先行しているが、マスク氏率いるxAIが
読む →
xAIは2025年7月、高速推論に特化した音声対話モデル「Grok Voice Think Fast 1.0」を発表した。このモデルは、ユーザーの発話から応答開始までの遅延を従来比で約40%短
読む →
xAIが提供する対話型AI「Grok」を、統合開発環境OpenCode上で直接利用可能にする新機能が2026年5月21日に発表された。SuperGrokもしくはX Premiumの既存サブスク
読む →
AIがコードを生成する領域は、いまやブラウザ上の統合開発環境(クラウドIDE)やエディタのプラグインを超え、開発者の最も原始的なインターフェースである端末(ターミナル)へと直接侵入し始めた。新
読む →
本記事で扱うのは、米国防総省が議会に提出したとされる非公開報告書が映し出すAIインフラ投資の急拡大である。国防総省の関与は安全保障レイヤーでの需要を可視化し、AI産業全体の供給制約を一段と意識
読む →
Colossusという名のスーパーコンピュータ建設計画が、AI産業におけるインフラ争奪戦の本質を浮き彫りにしている。xAIは2025年6月までに、テネシー州メンフィスの施設でNVIDIA H1
読む →
2025年のAI投資総額は1.9兆ドルに迫るとアナリスト予測されている。しかし一方で、AIスタートアップのうち事業化フェーズへ移行した企業は全体の21%にとどまる。巨額の資金流入が特定レイヤー
読む →
米国の研究チームが開発した新しいDNA損傷測定技術は、放射線治療の精度向上だけでなく、AI向け先端半導体の品質管理や災害時緊急対応までを包含する産業横断的な波及力を持つ。本技術の中核は、一本鎖
読む →建設現場でのプレキャストコンクリート部材の接合は、長年、施工精度と長期信頼性の両立が困難とされてきた領域である。米国国立標準技術研究所(NIST)のエンジニアチームは、この課題に対し5種類の新
読む →
全地球測位と通信の常識が火星圏で通用しなくなる段階に入り、米国国立標準技術研究所(NIST)が火星向け時刻同期基盤の理論的枠組みを発表した。これは単なる惑星科学ではなく、宇宙空間をデータセンタ
読む →
音声操作インタフェースを在宅医療に転用する動きが加速する中、米国国立標準技術研究所(NIST)が公表した新たなガイドラインは、単なる機器設定の注意点にとどまらない。スマートスピーカーが扱う患者
読む →
誰がこのニュースを読むべきか。量子コンピューティングのロードマップを追う投資家、産業用センサーの調達責任者、そしてAI推論チップの次世代材料に関心を持つ半導体エンジニアである。米国立標準技術研
読む →米国国立標準技術研究所(NIST)の研究チームは2025年、シリコンウエハー上に多様な波長のレーザー光源を微小回路上で実現する製造手法を確立した。特定波長に依存しない光集積回路の量産適性を高め
読む →
OpenAIは2025年、年間収益が110億ドルを突破する見通しを市場関係者に示した。この数字は表面的な企業業績の話題にとどまらず、AI産業の課金構造、推論コスト、そして自社製シリコン戦略の必
読む →NVIDIAに集中するAI半導体需要の地図を塗り替える可能性を秘めた研究成果が、NVIDIA自身の研究チームから発表された。Nemotron Labsが開発した拡散型言語モデルは、従来の自己回
読む →AMDのソフトウェアエンジニア、Andreas Karatzas氏が2025年に提案したパッチは、同社のGPU向け開発プラットフォーム「ROCm」の継続的インテグレーションパイプラインに、新た
読む →
NVIDIA、Amazon Web Services、Strandsの3社がエンタープライズ向け生成AIシステムの設計パターンを共同発表した。GPU推論、マネージドランタイム、サーバーレスオー
読む →AI特化型クラウドプロバイダーのCoreWeaveは2024年5月、Magnetar CapitalとBlackstoneが主導する総額23億ドルの融資枠を確保した。今回の調達は、AIモデルの
読む →
生成AIの商用利用が急拡大する中、大規模言語モデルや拡散モデルの訓練から推論に至るまで、その性能を正確に評価し、改善するための「計測と実験管理」の重要性がかつてないほど高まっている。今回のCo
読む →
CoreWeaveは大規模推論に特化したGPUクラウド事業者として知られる。同社は2025年7月、自社開発のLLM推論プロキシ「llm-d」をCloud Native Computing Fo
読む →
NVIDIAのNVIDIA HPC SDKとLCLS-II加速器が結びつき、ナノスケールX線自由電子レーザー計測の解析パイプラインが500倍高速化された。この成果は、次世代半導体と核融合炉材料
読む →今回Qualcommが公開した一連のパッチは、Hexagonプロセッサ向けのSSM-Conv(状態空間モデル向け畳み込み演算)処理を大幅に見直し、大規模プロンプト処理時のメモリ効率と実行条件を
読む →生成AIと大規模言語モデルの訓練・推論に特化したクラウドインフラ企業CoreWeaveが、シリーズBで221Mドルを調達した。主力投資家はMagnetar Capitalで、ブラックストーン系
読む →金融市場で競争優位を握る定量分析のインフラ選定基準が、処理速度一辺倒から信頼性、テナント隔離、GPU単位の可観測性へと急速に変質している。Man GroupやTwo Sigma、AQRといった
読む →
多くのAI開発チームが直面する課題は、モデルのトレーニング完了から実際のサービス提供までの工程にある。NVIDIAが2026年5月に公開した技術解説によると、この「AIサービング」段階での摩擦
読む →
NVIDIAはロンドンのAI研究所Ineffable Intelligenceと、強化学習インフラ構築に向けた技術協力を開始した。試行錯誤から自律的に知識を獲得するAIエージェントの実用化を加
読む →Perplexityが公開したコード修正は、大規模言語モデルの推論基盤を支えるC++ライブラリにおける整数オーバーフローの追加修正だ。一見すると地味なバグ修正だが、これがAI推論の安定性とGP
読む →
AI導入を進める企業のCFOにとって、クラウドサービスの公表価格だけを見て投資判断を下す時代は終わりを迎えつつある。大規模言語モデルの推論や再学習にかかるコンピューティングコスト、データ転送量
読む →AIモデルのローカル実行を支える基盤ソフトウェア「llama.cpp」が、ビルド番号b9181をリリースした。このリリースの本質は、HTTP通信ライブラリ「cpp-httplib」をバージョン
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」が、ビルドタグb9186を公開した。今回のリリースの本質は、単なるバージョン更新ではなく、単一のコードベースがカバーする
読む →マルチGPU推論の隠れた制約が露呈 llama.cppのビルド番号b9189において、GPUルーターモード動作時のCUDAプライマリコンテキスト生成を回避する修正が加えられた。この変更は一見す
読む →一般消費者には気づかれにくいが、大規模言語モデルを手元のデバイスで動かすエコシステムにおいて、ルータコンポーネントのバッファ割り当て戦略がヒープ領域に移行した。この地味な変更は、エッジAI推論
読む →これは1行のログ出力を抑える修正が、AI推論エンジンの地殻変動を映し出す話である。llama.cppの開発リリースb9192は「ngram: reduce noisy logs」という極小の変
読む →生成AIの推論実行環境であるllama.cppの最新ビルドb9194において、VulkanバックエンドにSSM_CONVとバイアス、SILU活性化関数を融合する最適化が加わった。この変更は、G
読む →llama.cppの最新ビルドb9196で、Vulkanバックエンドが非整列テンソルを用いたROPE処理に対応した。この変更は、Vulkan対応GPUを持つユーザーの推論精度とメモリ効率を改善
読む →ソースコードホスティングサービス上で公開されているllama.cppのビルド番号b9202のリリース資産一覧は、現在の大規模言語モデル推論環境が特定GPUベンダーのハードウェアに集中していると
読む →ソフトウェアの些末なビルド修正ログに見えるこのリリースは、大規模言語モデルを消費者デバイスで動かすエコシステムがどのような多層的ハードウェア世界で成立しているかを端的に示す資料である。ggml
読む →オープンソースAI推論エンジン「llama.cpp」のリリースb9216が、開発者体験とプロダクト安定性を両立する内部構造の大規模再編を完了した。今回の変更は単なるバグ修正ではない。コードベー
読む →llama.cppの最新ビルドb9222において、クアルコムのDSP「Hexagon」向けにTRI演算が追加された。これにより、Snapdragon搭載デバイス上での大規模言語モデル推論が、新
読む →llama.cppの最新ビルドb9240が公開された。一見するとヘルプ表示の修正という地味な更新だが、リリースバイナリの構成を読み解くと、AI推論の実行環境がどのように分散化し、多様化している
読む →llama.cppの最新ビルドb9244がQualcomm Adreno GPU向けにq4_k、q5_k、q6_kの量子化形式でMoEモデル推論を正式サポートした。貢献者はQualcomm T
読む →オープンソースの大規模言語モデル推論エンジン「llama.cpp」の開発コミュニティが、ビルド番号b9245を公開した。今回の更新で最も注目すべきは、AMDの最新GPUアーキテクチャRDNA3
読む →2025年7月1日、大規模言語モデル推論フレームワーク「llama.cpp」のビルドb9257がリリースされた。今回の更新の中核は、Vulkanバックエンドで使われるIM2COLシェーダーへの
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」が、ビルドb9259においてデバイス列挙機能のnullポインタクラッシュを修正した。この一見地味なバグ修正は、AI推論イ
読む →llama.cppの開発チームは、ビルド番号b9260においてOpenCLバックエンドの初期化処理とGPU識別機構の大幅な再構築を実施した。この修正は、ローカルLLM推論エンジンとして世界最大
読む →3月31日、Hugging FaceのエンジニアAdrien Gallouëtが署名したプルリクエスト「 23426」により、llama.cppの新ビルドb9264が公開された。このリリースは
読む →生成AIの推論環境を支えるllama.cppの最新ビルドb9267は、単なるバグ修正ではなく、多様化するバックエンド実装者への明確なシグナルを発信した。今回のプルリクエスト 23306では、2
読む →llama.cppの最新ビルドb9271が公開された。今回のコアとなる変更は、投機的デコーディングにおけるドラフトモデルの推論効率化である。具体的には、ドラフトモデルが後続トークンを生成する際
読む →2025年1月、Hugging Faceのエンジニアがllama.cppのビルド9904(b9272)に対し、バッチベンチマーク、推論パラメータの適合調整、量子化、およびパープレキシティ評価の
読む →llama.cppプロジェクトのビルドb9273が公開された。今回のリリースで最も注目すべき変更は、単一バイナリ下でルーターが子プロセスを生成する際のサブコマンド再注入機能の実装だ。これは一見
読む →llama.cppプロジェクトのビルドb9274は、一見すると軽微なバグ修正だが、AI推論基盤の資源管理に関する構造的な欠陥を浮き彫りにした。同ビルドでは、マルチトークン予測(MTP)モデルを
読む →Hugging Faceのエンジニアが主導し、軽量AI推論フレームワーク「llama.cpp」のビルド番号b9253において、複数の機能を単一の実行ファイルに統合したリリースが行われた。これに
読む →
アミン・ディルフーシ氏らが2026年3月、16のオープンソース強化学習(RL)ライブラリを分析した。同期RLでは推論がボトルネックとなりGPUが遊休化する問題を解決するため、推論と学習を分離す
読む →
中国のAI企業DeepSeek(ディープシーク)が2026年4月24日、大規模言語モデル「DeepSeek-V4」をリリースした。同モデルは100万トークンのコンテキストウィンドウを備え、長期
読む →
オープンソースAIモデルの新たな台頭 オープンソースAIスタートアップのNous Researchが、Anthropic社の「Claude Code」の急成長に対抗する新たなコーディングモデル
読む →
OpenAIがブロードコムと共同開発を進める独自AI半導体プロジェクトが、資金調達面で大きな壁に直面している。ブロードコム側が量産着手の条件として、マイクロソフトに対して全生産量の40%の購入
読む →
OpenAIは、人工知能の次世代インフラ構築プロジェクト「Stargate」を大幅に拡張すると発表した。同社は、汎用人工知能(AGI)の実現に向け、膨大な計算リソースを必要とする次世代AIモデ
読む →
Nvidiaは2025年に入り、人工知能(AI)関連企業への投資額が400億ドルを突破した。GPU市場での支配力を背景に、エヌビディアは単なる半導体サプライヤーからAI業界全体の資金循環を動か
読む →
米国北東部メイン州の人口約4600人の町ジェイで、地域経済を半世紀以上支えてきたアンドロスコギン製紙工場がデータセンターへと生まれ変わる。約1.4百万平方フィート(約13万平方メートル)という
読む →
商用契約とセットでエコシステム拡大を加速 エヌビディアがAI関連企業への出資を急拡大し、2024年の投資総額が400億ドルを超えたことが明らかになった。同社はこれまで半導体やAI基盤ソフトウェ
読む →
Nvidiaを守る最大の障壁は、最先端GPUに使われる半導体技術ではない。同社が20年近く投資してきた並列コンピューティング基盤「CUDA」こそ、競合他社が超えられない深い堀として機能している
読む →
Nvidiaに挑む米半導体スタートアップ、Cerebras Systemsが新規株式公開(IPO)で衝撃的な相場デビューを飾った。上場初日の株価は公開価格を約70%上回って取引を終え、株式市場
読む →
エヌビディアのジェンスン・フアンCEOが、設立から数カ月の英国スタートアップ「Ineffable Intelligence」に出資した。同社が4月に発表したシードラウンドの調達額は11億ドル。
読む →
Googleは半導体設計大手Broadcomとの戦略的パートナーシップを大幅に拡大する。生成AI(人工知能)向けの自社開発チップ「TPU」の生産能力を2027年までに現行の3倍に引き上げる計画
読む →
イーロン・マスク氏のAI開発企業xAIが、米テネシー州メンフィスに建設中のデータセンター「Colossus 2」で、可搬型ガス火力発電設備を19基追加導入していることが内部メールから明らかにな
読む →
米IT大手や新興企業による人工知能向け巨大データセンターの建設ラッシュが、世界各地で電力網への負荷や環境影響を巡る軋轢を引き起こしている。AIの需要拡大に支えられる設備投資は2030年までに総
読む →
2025年のアジア新興国市場で、台湾と韓国の株式相場が特異な局面を迎えている。両市場の代表的指数である台湾加権指数(Taiex)と韓国総合株価指数(Kospi)は史上最高値圏を更新し続ける一方
読む →
人工知能向け半導体市場で主役交代の兆しが鮮明だ。23日の週、米インテルとAMDの株価が前週比でそれぞれ13%超、マイクロン・テクノロジーが15%超急伸する一方、これまでAI相場を牽引してきたエ
読む →
米AMDのオープンソースGPU開発基盤「ROCm」上で大規模言語モデルを医用分野に最適化する試みが成果を上げている。NVIDIAの独自技術CUDAに依存せず、医療問診AIを低コストで稼働させる
読む →工作機械の加工可否を瞬時に判定するAIシステムがAMDのデータセンター向けGPU「Instinct MI300X」上に構築された。開発したのはカリフォルニア州サンノゼに拠点を置くAIスタートア
読む →
米国の対中半導体規制を契機に、中国のテクノロジー企業が国産AIチップへの巨額投資を加速している。エヌビディアが規制対応の「中国特供」製品で市場再参入を図るなかでも、この流れは止まらない。業界試
読む →
半導体大手エヌビディアのジェンスン・フアン最高経営責任者(CEO)が、ドナルド・トランプ米大統領の今週の中国訪問に同行することが明らかになった。フアン氏は当初の同行者リストに含まれておらず、ト
読む →
エヌビディアのジェンスン・フアン最高経営責任者(CEO)が、トランプ政権の訪中団に土壇場で加わった。同社が米政府から対中半導体輸出規制の厳格化を迫られる一方、売上高の2割弱を頼る中国市場との関
読む →
Nvidiaのジェンスン・フアン最高経営責任者(CEO)が17日、北京で記者団に対し「トランプ大統領が私に来るよう求めた」と発言した。米中首脳会談と並行する異例のタイミングでの訪中は、対中半導
読む →
市場関係者の間で、トランプ米大統領と習近平・中国国家主席による首脳会談が貿易休戦期間の延長につながり、低迷する中国ハイテク株を押し上げるとの観測が急速に広がっている。焦点は半導体規制の緩和だ。
読む →
米商務省はアリババやテンセント、バイトダンスを含む中国企業約10社に対し、エヌビディアのAI向け半導体「H200」を各社最大7万5000個購入する許可を出した。ところが実際には1個も出荷されて
読む →
米アマゾン・ウェブ・サービス(AWS)は、大規模基盤モデルの学習と推論に最適化したクラウドアーキテクチャの構成要素を公開した。生成AI需要の急拡大を受け、計算資源の効率的な配分とコスト削減を両
読む →
生成AIを悪用したサイバー攻撃の高度化に対し、セキュリティ業界はパラメータ数40億の小型言語モデルで対抗しようとしている。新たに登場した「CyberSecQwen-4B」は、GPU非依存のロー
読む →
個人投資家の熱狂が燻り続ける中、米Micron Technologyの株価が市場全体の軟調な推移に逆行して上昇している。背景には生成AI需要の拡大に伴う高帯域幅メモリの供給逼迫があり、アナリス
読む →
米国で大規模データセンター建設への反対運動が広がるなか、一般家庭に直接設置する新形態のAI処理基盤が開発段階に入った。クラウドに依存せず、個人が生成AIの推論や学習を自宅で完結させる構想であり
読む →
米アマゾン・ウェブ・サービス(AWS)は3月17日、バージニア州北部のデータセンターで発生した過熱障害により、暗号資産取引所Coinbaseやスポーツベッティング大手FanDuelを含む複数サ
読む →
半導体の演算処理装置(GPU)の賃貸料を原資産とする先物市場が新たに開設された。人工知能(AI)向け計算資源の需要急増でGPU調達コストが高騰する中、投資家や企業が将来の価格変動リスクを回避す
読む →
xAIのイーロン・マスクCEOは最新のAI推論基盤「Falcon Perception」の開発進捗を明らかにした。既存の大規模言語モデルと比較し、同等の推論性能を維持しながら計算コストを約10
読む →
米Googleは4月9日、オープンモデルとして提供する小型言語モデルの最新版「Gemma 4」を発表した。パラメータ数が10億強でありながら、画像とテキストを同時に理解するマルチモーダル機能を
読む →
米バイオテクノロジー企業がたった165ドルの計算コストで25種にわたる生物のmRNA解析用言語モデルを訓練した成果を発表した。巨大製薬企業が数億ドルを投じるmRNA創薬の基盤技術が、個人レベル
読む →
米国のAIスタートアップが、一般消費者向けGPUでも動作する高精度なインタラクティブ世界生成モデル「Waypoint-1.5」を発表した。専門知識がなくとも家庭用PCで複雑な3D環境を構築・操
読む →