[ダイジェスト] 第10回 GenAI 勉強会 の開催報告

第10回 GenAI 勉強会のダイジェストを執筆しました。

レポーターはGAIS事務局の村岡大地です。

アジェンダ

(1)柴山吉報氏「解説『生成AIの利用ガイドライン』」(弁護士/一般社団法人日本ディープラーニング協会 有識者会員)

(2)佐藤拓哉氏「生成AI最新動向 ~ 実際の生成AI導入相談からの現状と未来予測」 (アローサル・テクノロジー株式会社 代表取締役)

(3)サンミン氏「Dify Meetup ダイジェスト」(Dify アンパサダー / 株式会社ちょいみらい 代表)+ 河津大誠氏(株式会社AITech 代表)

(4)森 一弥氏「 データ連携利活用WG ~ RAG分科会報告」(アステリア株式会社 エバンジェリスト)

(5)嶋 是一氏「人材育成・教育WG報告」(株式会社KDDIテクノロジー CTO)

弁護士の柴山吉報氏が一般社団法人日本ディープラーニング協会(JDLA)が作成した「生成AI利用ガイドライン」についての登壇

柴山吉報氏の紹介

柴山吉報氏は、弁護士として活躍されているだけでなく、機械学習エンジニアとしても活動されている、まさにAI時代の法律のプロフェッショナルです。

1. 生成AIの基礎

生成AIの基礎知識について以下の3つをおさえておきます。

文章生成AI、画像生成AIの仕組み、技術的なリスクの3つです。

1.1 文章生成AI

文章生成AIには、多くのラージ言語モデル(LLM)が登場しています。

特に最近では、アテンション技術を使ったトランスフォーマーモデルによって性能が大幅に向上しました。

アテンション技術は文章中の単語の重要度を学習し、自然な文章を生成することができます。

有名なモデルとしては、GPTやGeminiなどがあります。

1.2 画像生成AI

画像生成AIには、テキストから画像を生成する「テキストtoイメージ」と、画像から画像を生成する「イメージtoイメージ」の2つの主な利用方法があります。特にVAEと呼ばれる技術が広く使われており、Stable Diffusion、Midjourney、DALLなどの有名なモデルが存在します。

1.3技術的なリスク

ハルシネーション:生成AIは自然な文章や画像を作成することが得意ですが、必ずしも正しい情報とは限りません。

学習データの漏洩:学習データに含まれる情報が出力されてしまうことがあります。 

悪用:ジェイルブレイクと呼ばれる手法を用いて、悪意を持ってAIを悪用することが可能です。

倫理上の問題:人種差別などの倫理的な問題が発生する可能性があります。

2. 生成AI利用時の法的リスク

生成AIを利用する際に発生する法的リスクについて、3つの段階に分けて考えることが大切です。法的リスクの3つの段階は、入力段階、出力段階、モデル選定の3つです。

2.1 入力段階

個人情報:個人情報保護法違反、機密情報管理ポリシー違反、秘密保持契約違反などのリスクがあります。 

秘密情報:社内機密情報や秘密保持義務を負う取引先からの情報を入力すると、漏洩や営業秘密の保護が失われるリスクがあります。 

著作権:他人の著作物に類似した画像を出力させようとした場合、著作権侵害のリスクがあります。

2.1.1 具体的な事例

A社のマーケティング担当者が、顧客の個人情報を含むデータを生成AIに入力した場合 

A社の技術者が、社内機密情報や取引先からの秘密情報を含むデータを生成AIに入力し、アイデアをブラッシュアップした場合。

2.1.2 リスクへの対応

個人情報と秘密情報:原則として入力を禁止し、例外的に許可する場合には、厳格なルールを設けます。 

著作権:他人の著作物を認識している場合、意図的に類似した画像を作成しないよう注意します。

2.2 出力段階:

著作権侵害:生成されたAI生成物が第三者の著作権を侵害していないか確認する必要があります。


著作権の発生:生成されたAI生成物に著作権が発生するのか、また発生する場合にはどのような条件で発生するのかを検討する必要があります。

2.2.1 具体的な事例:

A社のデザイナーが、生成AIで作成した画像を広告に使用したところ、クリエイターから著作権侵害を主張されました。

2.2.2 リスクへの対応:

著作権侵害:AI生成物に著作権侵害がないか確認する義務を設け、相談窓口を設置します。

著作権の発生:AI生成物であることが分かる形で管理し、対外的な公開は許可制とします。

2.3 モデル選定:

学習データ:生成AIモデルがどのような情報を学習しているのかを把握し、著作権侵害のリスクなどを評価する必要があります。

作風:特定の作風を模倣することを意図したモデルは、著作権侵害のリスクが高まります。

データの利用目的:入力したデータが学習に使われるか、AI生成物として出力されるかなど、データの利用目的を明確にする必要があります。

データの保存場所:個人データなどを入力する場合には、海外のサーバーに保存される場合の個人情報保護法の規制などを考慮する必要があります。

セキュリティ:生成AIを利用する際には、セキュリティ上の問題がないか確認する必要があります。

プロンプトの記録:プロンプトの記録などを管理することで、事後的な検証を容易にします。 利用規約:利用規約を確認し、商用利用の可否などを確認します。

2.3.1 モデル選定におけるリスクへの対応

モデル審査:AIモデルを事前に審査し、承認されたもののみ利用を許可します。

生成AI最新動向 ~ 実際の生成AI導入相談からの現状と未来予測~ 佐藤拓哉氏講演内容解説

佐藤拓哉氏の紹介

佐藤拓哉氏は、エンジニア出身で2015年からAI関連の仕事に従事し、AI導入のコンサルティングや研修などを幅広く行っています。メディアにも積極的に出演しており、AI分野の第一人者として活動しています。

1. 海外におけるAIファーストのDX推進と日本の現状

海外ではAIファーストのDX推進が加速しており、リストラが進む一方で、企業の利益や売上は好調です。一方、日本ではAIエンジニア不足が深刻化しており、従来型のIT人材も10万人以上不足しています。
海外では、AIを活用した自動化やデータ分析により、業務効率が向上し、人材の削減が進んでいます。一方、日本ではAIエンジニアの育成が遅れているため、企業のAI導入が進んでいません。
日本は、AI技術導入を加速させ、人材育成を強化することで、海外との競争力を維持していく必要があります。

2. 生成AIの導入状況と課題

生成AIは文章作成や画像生成など多様なタスクを自動化でき、企業にとって魅力的な技術です。しかし、導入企業が増加する一方で、利用率は低迷しており、専門知識を持った人材の不足や導入方法の不明瞭さが大きな課題となっています。効果的な活用には人材育成や導入支援が必要であり、これにより企業は生成AIの潜在能力を最大限に引き出すことができます。

3. AI勢力図の変化 – Appleの参入と今後の展望

Appleが生成AI分野に参入し、AI勢力図は大きく変化しています。Appleは、ユーザー体験を重視したAI開発を進めており、他の企業とは異なる戦略をとっています。
従来、AI分野ではMicrosoft、OpenAI、Google、Amazonなどが主要なプレイヤーでした。しかし、Appleの参入により、競争がさらに激化する可能性があります。
Appleは、SiriにChatGPTを統合するなど、生成AI技術を活用したサービスを開発しています。また、Appleは、ユーザー体験を重視したAI開発を進めており、他の企業とは異なる戦略をとっています。
Appleの参入により、AI分野はさらに活発化し、新たなサービスや製品が登場する可能性があります。

4.生産性が50倍の成功事例

サイバーエージェントの広告チームは生成AI導入により生産性が50倍になりました。他の企業でも、生産性が10倍になることは現実的に可能と考えられます。

成功事例:サイバーエージェントとGMO

サイバーエージェントやGMOなどは生成AIを活用し、業務効率化と生産性向上を実現しています。サイバーエージェントでは広告制作や顧客分析で成果を上げ、GMOではロボット開発や新規事業開発を推進しています。生成AIの活用により、これらの企業は競争優位性を獲得しています。

5.到来するAIエージェントの時代 – 準備と活用

今後、AIはチャットボットから能動的に行動するAIエージェントへと進化し、人間に代わって高度なタスクをこなすようになります。Appleが開発中のAppleインテリジェンスのように、AIエージェントは様々なアプリタスクを横断してユーザーをサポートし、人間の生活や仕事に大きな変革をもたらす可能性があります。このAIエージェント時代に備えるためには、企業は業務フローの整理や自社データの活用など、事前に準備を進める必要があります。これにより、AIエージェントは効率的にタスクを処理し、精度の高い判断が可能となり、企業は新たなビジネスチャンスを掴むことができます。

特別講演:サンミン氏「Dify Meetup ダイジェスト」

サンミン氏の紹介

株式会社ちょいみらい代表のサンミン氏がDifyアンバサダーを務めています。

河津氏の紹介

株式会社AITech 代表の河津大誠氏

1. Dify Meetupの概要

この動画は、2023年6月23日に行われたDify Meetupのダイジェスト版です。Difyは、AIを活用した業務効率化ツールで、株式会社ちょいみらいのサンミン氏がアンバサダーを務めています。動画では、サンミン氏によるDifyの活用事例紹介、カカクコムにおけるDify導入事例、スマホアプリ開発におけるDify活用事例などが紹介されています。

2. Difyの活用事例:業務効率化

サンミン氏は、Difyを用いた業務効率化の具体的な事例として、3つの方法を紹介しています。

RAGの導入: 地方共通相談チャットボットの開発を例に、Difyを用いることで3時間程度の開発時間で実現可能であることを示しています。

医療現場のレポートの作成効率化: 医療現場における生活習慣病の利用計画書の自動作成を例に、患者との面談内容を文字起こしし、AIに渡すことで素案作成を自動化できる可能性を示しています。

決まった時間にAIアプリを起動: Difyで開発したアプリを、特定の時間に起動させる方法を紹介しています。ウェブサイトの情報をクローリングし、スクレイピングしたデータをNotionのデータベースに埋め込むアプリの例では、実際に自動実行されている様子が確認できます。

Difyは、チャットボット開発、レポート作成、アプリの自動実行など、様々な業務の効率化に役立つツールです。

3. Difyの今後のロードマップ

Difyは、現在中国とアメリカにオフィスを構えていますが、今後日本にもオフィス開設を検討しているとのことです。また、開発面では、現在イメージファイルしかアップロードできないファイル形式を、動画、音源、PDFなどにも対応させる予定とのことです。Difyは、日本市場への進出を本格化させ、機能面でも更なる進化を遂げようとしています。

4. 1ヶ月かかるアプリ開発を1日で実現

カカクコムは、Difyを導入することで1ヶ月かかるアプリ開発を1日で実現しました。これにより、開発期間の大幅な短縮と開発効率の向上に成功しています。

5. Difyの強みと今後の展望

Difyの強みは、最新のAIモデルへの迅速な対応と本番環境への導入の容易さです。Difyは常に最新のAIモデルに対応し、高性能を維持します。また、クラウド版とローカル版の両方を提供し、ユーザーのニーズに応じて柔軟に利用できます。これにより、さまざまな業務で高いパフォーマンスを発揮する可能性があります。

Difyは汎用性の高いツールですが、効果的に使うには明確な課題設定と最適な機能の理解が重要です。まず、自分の目的を明確にし、それに適したDifyの機能を学びましょう。Difyはまだ発展途上で、いくつかの課題があります。頻繁なオープンソースコードのアップデートに追いつくのが難しい点や、サーバー管理など運用面での技術力が必要な点が挙げられます。今後の更なる発展が期待される一方で、アップデート対応や運用面での課題も解決が求められます。

GAISデータ連携利活用WG RAG分科会報告 – 森 一弥氏

森 一弥氏の紹介

アステリア株式会社 エヴァンジェリスト

1. はじめに:RAG分科会とセミナーの概要

データ連携利活用ワーキンググループ(WG)内のRAG分科会は、RAG技術の学習と実践を目的に活動しています。2023年5月30日には「RAG開発セミナー」を開催しました。セミナーでは「Difyで始めるRAG」と「RAGの制度安定化」の2つのセッションが行われました。本報告では、RAG技術の概要、Difyを用いたRAG開発環境構築、RAGの精度向上の取り組みについて紹介します。

2. RAG技術の概要:ベクターストアとLLM

RAG技術は、ベクターストアを使ってLLMにない情報を検索し、適切な回答を生成する技術です。従来の検索エンジンがキーワードに基づいて情報を検索するのに対し、RAG技術は文章の意味を理解し、関連情報を検索できます。例えば、社内資料をベクターストアに格納して検索すると、車に関する質問にも適切に回答できます。RAG技術はLLMの能力を拡張し、幅広い情報に対して適切な回答を生成できるため、様々な分野での活用が期待されています。

3. Difyを用いたRAG開発環境構築

Difyを使うと、RAG開発環境を簡単に構築できます。Difyはブロックチェーン技術を使った分散型金融サービスで、RAG開発において分散型ストレージや計算リソースを活用できます。本セミナーでは、AWSを使ったRAG開発環境の構築について説明されました。具体的には、CPU2つ、メモリ4GB〜8GBの軽めのサーバー1台で構築可能です。Difyを利用することで、低コストでRAG開発環境を構築でき、開発のハードルが下がります。

4. RAGの精度向上:データの整理とチャンク化

RAGの精度向上には、データの整理とチャンク化が重要です。RAGは入力データに基づいて回答を生成するため、データの質が精度に影響します。データを整理し、チャンク化することで、RAGがデータを正確に理解しやすくなります。例えば、大きな表データはマークダウン形式に変換すると精度が向上します。また、文章を適切なサイズに分割することも効果的です。データの整理とチャンク化は、RAGの精度向上に欠かせない要素です。

5. RAGの運用と体制構築:継続的な改善と効率化

RAGの効果的な運用には、継続的な改善と効率化が不可欠です。導入後もユーザーのフィードバックを収集し、モデルの学習データやパラメータを調整することで、より精度の高い回答を生成できます。本セミナーでは、ユーザーの要望対応や業務効率化が運用上の課題として挙げられました。RAGの運用には、継続的な改善と効率化の体制構築が重要です。

6. まとめ:RAG技術の可能性と今後の展望

RAG技術は、LLMの能力を拡張し、幅広い情報に対して適切な回答を生成できるため、様々な分野での活用が期待されています。例えば、顧客対応の自動化、情報検索の効率化、文書作成の支援などに役立ちます。今後も発展が期待され、各分野での革新をもたらす可能性があります。

GAIS「人材育成・教育WG報告」

是一氏の紹介

株式会社KDDIテクノロジー CTO

教育ワーキンググループの紹介

教育ワーキンググループは、生成AIを活用した教育の未来を創造するために、教育現場における生成AIの活用促進を目指して様々な取り組みを行っており、生成AIを活用した教育の倫理的な問題や課題についても議論を進めています。今後も、教育分野におけるAI活用の促進に貢献し、生成AIを活用した新たな教育方法や教材開発を推進して、より効果的で質の高い教育を実現することを目指します。また、教育関係者とAI開発者の連携を強化し、AI技術の教育分野における社会実装を加速させることを目指しています。人材育成・教育ワーキンググループは、このような取り組みを通じて教育分野におけるAI活用の未来を切り拓くことが期待されます。

ChatGPTを活用したライブ演奏: 音楽とAIの融合

嶋 是一氏は、個人活動として、ChatGPTを活用したライブ演奏を行い、音楽とAIの融合という新たな表現方法に挑戦しています。ライブ演奏では、ChatGPTが生成したショートストーリーと画像を元に即興演奏を行い、観客からの言葉による補題を元にChatGPTがストーリーを生成することで、観客とのインタラクティブな演奏を実現しています。この活動の目的は、音楽とAIの融合による新たな表現方法を探求し、観客に新しい音楽体験を提供することであり、ChatGPTを活用することで音楽表現の幅を広げ、より深みのある演奏を実現することを目指しています。ChatGPTを活用したライブ演奏は、音楽とAIの融合という新たな表現方法の可能性を示しており、今後、AI技術を活用した音楽表現がさらに発展していくことが期待されます。

佐藤雄太の紹介

株式会社みんがく(Mingaku Co., Ltd. ) 代表.

教育AIサミット2024 とは

教育AIサミット2024は、教育分野におけるAI活用促進を目指すイベントで、株式会社みんがく代表の佐藤雄太氏が企画・運営しています。教育分野での生成AI活用はまだ始まったばかりで、導入率は0.3%と低く、多くの教育関係者が生成AIに対する不安感や理解不足を感じています。本サミットでは、教育関係者、AI開発者、政府関係者などが参加し、「教育×生成AI」をテーマに、生成AIの可能性と課題について講演やパネルディスカッションを行います。イベントは国会議員会館でのリアル開催とオンライン開催のハイブリッド形式で行われ、教育分野でのAI活用促進、関係者間の連携強化、AI技術の社会実装を加速することを目指しています。