【JAPAN AI】Research Engineer, LLM/Agent / Japanese
Research Engineer, LLM/Agent / Japanese
エージェント研究開発
異なるエージェント・ハーネスの発案・開発・比較 (メモリ、コンテキスト圧縮、エージェント間通信アーキテクチャ等)
新しい推論・計画・検索手法の研究開発
マルチモーダル・長文コンテキスト対応の技術開発
最新論文の調査・再現・改良実装
評価・ベンチマーク
大規模なエージェント型タスクのための厳密な定量ベンチマークの設計・実装
合成データ生成・評価ベンチマーク設計
モデルとプロンプトの自動評価支援 (学習 → プロダクトライフサイクル全体)
プロダクション課題の解決
推論レイテンシ / コスト最適化 (量子化、蒸留、キャッシュ等)
モデル学習用データミックスの作成・最適化
エージェント評価フレームワークの高度化
本番環境での品質改善・パフォーマンスチューニング
技術移転・発信
Agentic Product Engineer チームへの技術移転・メンタリング
学術機関・OSS コミュニティとの連携
【業務シナリオ例】
※以下は想定される業務シナリオの例です
● シナリオ 1 : SaaS 横断検索のためのナレッジグラフ
RAG の研究開発 JAPAN AI STUDIO が「企業の脳」として機能するには、顧客の全 SaaS に散在する情報を横断的に検索・統合する必要がある。
既存の RAG では「Aプロダクト の従業員データ」と「Bプロダクト の商談データ」の関係性を捉えられず、回答精度が低い。
ナレッジグラフベースの RAG アーキテクチャを研究・開発し、エンティティ間の関係性を構造化。
SaaS 横断検索の回答精度を 40% 向上させ、Agentic Product Engineer チームに技術移転して全プロダクトに展開。
●ミッション
Agentが降参する問題を解く
現在の AI エージェントでは解決できないフロンティア課題に挑み、新しい推論手法・検索 / 計画・長期記憶・ツール利用の品質限界を突破する。
JAPAN AI STUDIO 上で動く数百のワークフローが、より賢く・速く・安全に動作する未来を、研究で切り拓く。
●期待する役割について
Research Engineer として、AI/LLM/ML の最先端研究と応用研究をリードしていただきます。
異なるエージェント・ハーネスの発案・開発・比較 (メモリ、コンテキスト圧縮、エージェント間通信アーキテクチャ等)
大規模なエージェント型タスクのための厳密な定量ベンチマークの設計・実装
モデルとプロンプトの自動評価を支援し、学習からプロダクトライフサイクル全体にわたって品質を担保
プロダクト組織と協力し、エージェントをプロダクトに適用するうえでの最も困難な課題を解決
モデル学習用データミックスの作成・最適化により、エージェントタスクにおける性能と使いやすさを向上
研究成果を Agentic Product Engineer チームに移転し、プロダクト全体の品質を底上げ
論文を書くことがゴールではありません。
研究成果をプロダクションに適用し、約 200 社が利用する本番環境でユーザーに届けることを重視します。
●成果責任 (KR/メトリクス)
ベンチマークスコア改善率 (社内 / 公開ベンチマーク)
新手法のプロダクション適用数 (四半期あたり)
推論レイテンシ / コスト改善率
論文・技術ブログ発表数
社内技術移転完了数
●チーム体制
約120名が開発組織に在籍しています。
Research Engineerは以下のプロジェクトを横断して活動します:
JAI Lab — AI研究開発
AI&Model — モデル学習・最適化
Voice & Tel — 音声AI・電話システム
密接に連携する役割:
Agentic Product Engineer — エージェント機能開発 (技術移転先)
Agent Harness Engineer — エージェント実行基盤
AI QA Specialist — 評価パイプラインとの連携
Product Manager — プロダクト設計
●開発環境
言語 : Python (研究・フレームワーク部), TypeScript / React / Next.js (フロントエンド部) / NX
ML / AI : PyTorch, JAX, Transformers, vLLM, Weights & Biases
インフラ : GCP (コンテナ / K8s), Docker
ツール : Slack, Confluence, Linear, Google Workspace, GitHub, Notion
AI 開発支援 : Claude Code MAX Plan, Cursor, ChatGPT, Devin
作業環境 : Mac (Apple Silicon), デュアルモニタ対応