2024年も残すところあとわずか。
特に「生成AI」の分野でニュースに事欠かない一年でした。
今回は、生成AIの話題の中でも、特に重要だと思う5つのニュースを厳選してご紹介します。
1. Appleが独自の生成AI「Apple Intelligence」を発表、ChatGPTとの連携も
日本時間で2024年6月11日から開催されたAppleの開発者向けカンファレンス「WWDC 2024」で、独自開発の生成AI「Apple Intelligence」が発表されました。iPhoneなどのiOSデバイスに搭載、一部のサービスではOpenAIのChatGPTと連携。
9月10日に発売されたiPhone 16(iOS 18)では、すでにApple Intelligenceが搭載されています(iPhone15 Pro以上の端末が必要)。日本語などの追加言語は2025年から使用可能となる予定です。
音声アシスタント「Siri」、テキスト生成、画像生成などさまざまな機能にApple Intelligenceが使われます。詳しくは、以下の過去記事で解説していますので、ぜひご覧ください。
過去記事:iOS 18で追加される7つの注目機能。正式版は2024年9月20日ごろにリリース?
AppleがAI分野に参入し、さらにChatGPTと連携を図ることで、特に生成AIの分野で競争の激化が予想されます。
なお、Appleが発表した同日、イーロン・マスク氏は「AppleがOpenAIの技術を使うと、プライバシー保護やセキュリティの面でリスクが生じる」と主張。マスク氏は生成AI企業「xAI」に関わっており、Appleへの牽制という意味合いがあるのかもしれません。
参考:Apple「iPhone、iPad、Macの中心にパワフルな生成モデルを据えるパーソナルインテリジェンスシステム、Apple Intelligenceが登場」
2. ChatGPTの最新モデル「GPT-4o」が登場。主に4つの機能がアップデート
2024年5月13日、ChatGPTを開発するOpenAIが、最新モデル「GPT-4o」を発表しました。「o」は「オムニ(Omni)」が由来で、テキスト、音声、画像、動画をシームレスに扱えることを意味しています。
GPT-4oは、従来のGPT-4モデルをもとに、応答速度と精度を大幅に向上させたモデルです。複雑なタスクをより自然に処理し、多言語対応や感情理解などの機能が強化されています。具体的には、応答速度の向上、マルチモーダル対応、感情理解、コスト削減の4つの点がアップデートされています。
応答速度はテキスト生成では約2倍の生成スピードに。従来モデルはテキスト処理にしか対応しておらず、音声や画像、映像の処理には別のモデルを組み合わせる必要がありましたが、マルチモーダル対応はテキストだけでなく音声や画像、動画などからの情報処理が可能に。感情理解は「もっと感情的に話して」「もっと機械的に話して」などと指示すると、それに応えてくれるようになりました。さらに、GPT-4oではAPIの利用料金が従来の半分に。無料版でもGPT-4oの技術が利用でき、コストがネックだったユーザーにも、無料版を使い続けているライトユーザーにも恩恵があります。
また、11月20日にはGPT-4oの最新アップデートを発表。新バージョン「GPT-4o-2024-11-20」ではライティング能力とファイル処理能力が大幅に向上したとのこと。
4月には日本語特化モデルを発表したChatGPT。日本人の開発者だけでなく、一般ユーザーにとってもさらに便利になりそうです。
参考:AI Market「GPT-4o(omni)とは?仕組み、価格、活用方法を徹底解説!」
3. Google出身のAI研究者が設立した「Sakana AI」が、AIユニコーン企業に
2023年7月にGoogle出身の著名なAI研究者らが、日本を起点にアジアや世界へと技術の利用者を広げることを目指して設立した新興企業「Sakana AI(サカナAI)」が、2024年6月に約200億円の資金を調達することになりました。
NVIDIAが数十億円を出資、米ベンチャーキャピタルのNEA(ニュー・エンタープライズ・アソシエイツ)、コースラ・ベンチャーズやラックス・キャピタルなども。企業価値は11億ドル(約1,700億円)超えることになり、日本初のAI分野でのユニコーン企業(評価額が10億ドル以上で設立10年以内の未上場ベンチャー企業のこと)となりました。
共同創業者のライオン・ジョーンズ氏とデビッド・ハ氏は、日本の食事や文化に魅了され、東京を拠点に選んだそう。
Sakana AIは「小さな魚が群れを形成するように」、異なる特徴を持つ複数のAIを組み合わせて、高度なAIを生み出すことを目標としています。この方法によって「日本語で数学の問題を解く大規模言語モデル」「進化したユニバーサルトランスフォーマーメモリ」などを発表。
Sakana AIの今後の動向に、要注目です。
参考:JBpress「【あのエヌビディアが出資】急成長『Sakana AI』とは何者か?設立1年で評価額11億ドル越えユニコーンの革新性」
4. Googleが動画生成AI「Google Vids(ビズ)」を発表。プレゼン動画の作成が手軽に
2024年4月、Googleはプレゼン動画などを作成する動画生成AI「Google Vids(ビズ)」を発表しました。現在ではGoogle Workspaceの多くのプランで利用できます。
参考資料(Google ドキュメントやPDFなど)をアップロードし、どのようなプレゼンを作りたいかをテキストで指示したあと、プレゼンのスタイルを選択し、「台本を書いてほしい」「台本に沿った音声を生成してほしい」などとテキストで指示したあと、性別や人種などにもとづく候補の中から音声(ナレーター)を選択。最後にデザインなどを選択して完成、という流れで動画を生成します。
OpenAI社が2月に動画生成AI「Sora」を発表したばかり。SoraはText-to-Video、Image-to-Video、Video-to-Video、画像生成などに対応していますが、「プレゼンを丸ごと生成」という切り口で登場したGoogle Vidsに、今後も注目しましょう。
参考:Google Workdpace「Google Vids: オンライン動画作成および編集ツール」
5. AI技術の中核「機械学習」の基礎を築いた2名がノーベル物理学賞を受賞
2024年10月、米プリンストン大学のジョン・ホップフィールド教授と、カナダ・トロント大学のジェフリー・ヒントン教授の2人が、2024年のノーベル物理学賞を受賞しました。
画像出典:The Japan Times
ホップフィールド教授は人間の神経回路を模倣した「人工ニューラルネットワーク」を使って、物理学の理論から画像やパターンなどのデータを保存し、再構成できる「連想記憶」と呼ばれる手法を開発。この手法によって、不完全なデータから元のデータを再現できるように。
ヒントン教授はこの手法を統計物理学の理論などを使って発展させ、学習した画像などの大量のデータをもとに可能性の高さから未知のデータを導き出すアルゴリズムを開発。
2人の研究は、現在のAI技術の中核を担う「機械学習」の基礎となり、その後「ディープラーニング」など新たなモデルの確立につながりました。ノーベル賞の選考委員会は、2人の功績について「1980年代以降、『人工ニューラルネットワーク』の研究開発において、重要な業績を積み重ねていて、すでに多くの恩恵をもたらしている。物理学の分野では、特定の性質を備えた新たな物質の開発など極めて幅広い分野で『人工ニューラルネットワーク』が使われている」と評価し、ノーベル物理学習の授与を決めました。
AI技術の基礎研究が、物理学の分野で高く評価された画期的な出来事として注目を集めました。
参考:NHK News Web「ノーベル物理学賞にAIの中核『機械学習』の基礎に関わった2人」
まとめ
以上、2024年の生成AIニュースの中でも注目の5つをご紹介しました。
日本では、日本新聞協会が7月に生成AIの検索連動型サービスに対して、著作権侵害に該当する可能性が高いとの懸念を示し、検索市場を独占する事業者が記事の無断利用を強行すれば「公正競争をゆがめる」と主張。8月には日本マクドナルドが公開したAI生成のイラストとアニメーションを使用した広告動画がSNS上で賛否を巻き起こすなど、AIによる著作権侵害問題や二次利用の問題などが浮き彫りになりました。
また、OpenAIの創業メンバーの退社が相次ぐ(共同創設者のひとりであるジョン・シュルマン氏や、ChatGPTの開発を率いたピーター・デン氏)など、業界をリードする企業にもさまざまな変化が起こっています。
今後もさまざまな生成AI技術の動向に注目していきましょう。