こんにちは。JAPAN AI カスタマーサクセス部の青木(@JAPANAI_KenAoki)です。
テックブログをエンジニアでもない私が書くのも変かもしれませんが、今回は普段からお客様の「生成AI活用に関する悩み」に向き合っている私だからこそ書けるブログを書かせていただきます。
とはいえ、今更「AIで議事録を作れます」「アイデア出しができます」といった類の事例を紹介されたところ面白くないと思いますので、生成AIの可能性を感じていただける少しマニアックな事例を紹介できればと思います。
「生成AIで業務効率化」と聞いて、多くの方が思い浮かべるのは、上で書いたような文章作成や要約といった定型業務かもしれません。しかし、本当にクライアントの皆様の時間を奪っているのは「専門的だが単調な作業」だと感じております。
例えば、倉庫や工場のネットワーク設計において、フロアプランにWi-FiのAP(アクセスポイント)を配置する作業。これは専門知識が必要な一方で、「エリアを検出して、一定間隔で配置する」という極めてルールベースな作業です。設計者は1つの案件で何十枚もの図面を処理し、PowerPointで手作業でアイコンを配置していく——この繰り返しに数時間(時には数日)を費やすこともあるそうです。
「こういう作業こそ、AIに任せられないか?」
そんな現場の声から生まれたのが、今回ご紹介するAPプロット図自動生成AGENTです。
大前提として、今回のAGENTでは「Code Interpreter」という技術を使用しております。Code Interpreterは、LLMにサンドボックス化されたPython実行環境を与える仕組みです。各LLMで利用が可能であり、以下の特徴があります:
User Input (自然言語 + 画像)
↓
LLM (意図理解 + コード生成)
↓
Sandboxed Python Runtime
├─ numpy, pandas, matplotlib
├─ opencv-python
├─ python-pptx
└─ pillow, scipy, etc.
↓
Output (画像/PPTX/CSV等)
重要なポイント
| 手法 | 柔軟性 | 実装コスト | 保守性 |
|---|---|---|---|
| 手作業 | ◎ | - | - |
| RPA (UiPath等) | △ | 高 | 低 |
| 固定スクリプト | × | 中 | 低 |
| Code Interpreter | ◎ | 低 | 高 |
Code Interpreterの真価は、「自然言語で指示できる汎用性」と「コード実行の確実性」の両立にあります。また、実行してほしいコードの例をシステムプロンプトに事前に記載しておくことで、コードの解釈と実行作業内容にランダム性が発生してしまう事象を抑制することができます。今回のAGENTも、システムプロンプトにゴリゴリコードを書いてます。