
なぜ「AI面接官」だったのか? - 開発のきっかけ
日本の多くの企業が、少子高齢化による人材不足、特に中核を担う人材の採用に苦労しているという話は、皆さんも耳にする機会が多いのではないでしょうか。実際、約7割の企業がこの課題に直面していると言われています。一方で、人事部門のリソースは限られており、採用プロセス、特に面接に十分な時間と労力を割けないという現実もあります。
私たちのチームでは、「この課題を AI エージェントで解決できないか?」という議論からスタートしました。「単なるチャットボットではなく、本当に人間と対話しているような、自然な面接体験を提供できないだろうか?」そんな思いから、「AI 面接官」のアイデアが生まれました。目指したのは、採用面接のプロセスを自動化し、人事担当者の負担を軽減しつつ、候補者にとっても質の高い面接体験を提供できるソリューションです。
「AI面接官」でできること - 機能紹介
私たちが開発した「AI 面接官」は、大きく分けて以下の3つの機能を持っています。

図:AI面接官の主要機能
- まるで本物?パーソナライズされた面接官: 企業の担当者の顔写真と声データをアップロードするだけで、その人そっくりのリアルなアバターが面接官として登場します。声もクローニング技術で再現するので、本当にその人が話しているかのような自然さを目指しました。企業文化に合わせて、面接官の話し方や雰囲気をカスタマイズすることも可能です。
- 面接内容もカスタマイズ: 企業ごとに聞きたい質問や評価したいポイントは異なりますよね。このシステムでは、質問セットや評価基準、さらには面接官の経歴や役職といった詳細情報まで設定できます。これにより、AI は企業のニーズに合わせた的確な質問を投げかけ、候補者の回答を深く掘り下げることができます。
- 客観的な評価を自動で: 面接が終わると、AI が候補者の回答内容や話し方などを分析し、事前に設定された評価基準に基づいて評価レポートを自動生成します。「この候補者は次の選考ステップに進むべきか」といった判断をサポートし、より客観的で公平な評価を実現します。

図:候補者評価の流れ(イメージ)
開発の舞台裏:立ちはだかった技術の壁と、乗り越えるための工夫
アイデアを形にする過程では、いくつかの大きな技術的挑戦がありました。特に、自然でリアルタイムな対話体験を実現する部分には多くの試行錯誤がありました。

図:システム構成の概要
- 「間」との戦い:エンドツーエンド音声 LLM とリアルタイム応答:
- 課題: 面接は会話のテンポが重要です。候補者が話終わってから AI が応答するまでに時間がかかると、一気に不自然になってしまいます。音声認識(STT)、LLM による応答生成、音声合成(TTS)をスムーズに連携させ、人間同士の会話に近いリアルタイム性を実現する必要がありました。
- 工夫: まず、音声認識には日本語認識精度が高いと評判だった Nova-2 STT API を試しました。応答生成と音声合成をいかに高速化するかが鍵で、ここではリアルタイム処理に特化した OpenAI の Real-time API (gpt-4o-realtime-preview) と WebRTC/WebSocket を組み合わせるアプローチを採用しました。これにより、音声を入力しながらほぼ同時に応答音声を生成し、会話の遅延を最小限に抑えることを目指しました。ハッカソン期間中は、この遅延との戦いが一番ヒリヒリした部分かもしれません(笑)。