【JAPAN AI】Agent Harness Engineer / Japanese
Agent Harness Engineer / Japanese
Agent Harness の設計・実装
エージェント実行エンジン (Graph Runtime / State Machine) の設計・実装
Agent SDK の設計・開発 — 社内エンジニアがエージェントを構築するためのインターフェース
セッション管理・チェックポイント・リカバリ機構の実装
ガードレール / ポリシー実行エンジンの構築 — エージェントの行動を制御するルール実行基盤
AI/ML システム統合
モデルルーティング — 複数の LLM プロバイダ / モデルタイプを跨いだ推論リクエストの最適ルーティング
コンテキスト管理・メモリ基盤の設計 (長期記憶、ワーキングメモリ、RAG 統合)
推論パイプラインの最適化 (レイテンシ削減、コスト効率化、キャッシュ戦略)
Research Engineer と連携した最新研究成果の本番基盤への統合
オーケストレーション・パフォーマンス
ワークフローオーケストレーション・キューイングシステムの開発
コスト/性能最適化 (オートスケーリング、キャッシュ、バッチ処理)
推論リクエストのルーティング・ロードバランシング
信頼性・運用
プラットフォーム稼働率 99.9% 以上の維持
インシデント対応・ポストモーテム
データアクセス・権限管理基盤の設計
【業務シナリオ例】
※以下は想定される業務シナリオの例です
● シナリオ 1: エージェント実行エンジンの設計 JAPAN AI STUDIO 上で顧客が構築する AI エージェントの実行基盤を設計。
Graph Runtime を採用し、エージェントの各ステップを DAG (有向非巡回グラフ) として表現。
チェックポイント機構により、長時間タスクの途中失敗からの自動リカバリを実現。
● シナリオ 2: モデルルーティングの最適化 複数の LLM プロバイダ (OpenAI / Anthropic / Google 等) を跨いで、タスクの種類・コスト・レイテンシに応じた最適なモデルを自動選択するルーティングエンジンを設計。
推論コストを 25% 削減しつつ、タスク成功率を維持。
● シナリオ 3: ガードレール実行エンジンの構築 金融機関向けエージェントが「投資助言」に該当する回答を生成しないよう、ポリシー実行エンジンを構築。
ルールベース + LLM ベースのハイブリッド判定により、レイテンシを 50ms 以内に抑えつつポリシー準拠率 99.5% を達成。
●ミッション
「企業の脳」の心臓部を設計する
AI エージェントが安全・高速・確実に動作するための Agent Harness — 実行エンジン、オーケストレーション、ガードレール、メモリ、モデルルーティングを設計・実装する。
JAPAN AI STUDIO 上で動く数百のワークフローの制御基盤を、自社で構築する。
●Agent Harnessとは
Agent Harnessは、AIモデルを包み込む制御・実行基盤レイヤーです。
Agent Framework (LangChain等) がエージェントの「構築」を担うのに対し、Agent Harnessはエージェントの「制御・運用」を担います。
●Backend Engineer
構築対象 : Web API・マイクロサービスの設計・実装
AI/ML との関わり : ML モデルを API 経由で呼び出す
状態管理 : ステートレスなリクエスト / レスポンス
安全性制御 : 認証・認可・入力バリデーション | ガードレール / ポリシー実行エンジン — LLM の出力を制御するルール実行基盤
●Agent Harness Engineer
構築対象 : LLM を中核としたエージェント実行エンジン・SDK・オーケストレーターの設計・実装
AI/ML との関わり : モデルルーティング、RAG 統合、コンテキスト注入、推論最適化をシステムレベルで設計
状態管理 : エージェントのセッション管理・チェックポイント・長期記憶・ワーキングメモリの設計
安全性制御 : ガードレール / ポリシー実行エンジン — LLM の出力を制御するルール実行基盤
JAPAN AI では、この Agent Harness を自社開発し、全プロダクト (JAPAN AI STUDIO / CHAT / SPEECH / AGENT 等) の共通基盤として運用しています。
●期待する役割について
Agent Harness Engineer として、AI / ML の知識を活かしながらエージェントの制御・実行基盤を設計・実装していただきます。
LLM / AI エージェントの動作原理を深く理解した上で、実行エンジン (Graph Runtime / State Machine) を設計・実装する
モデルルーティング、コンテキスト管理、メモリ基盤 (長期記憶・ワーキングメモリ) など、AI 特有のシステム設計を担う
社内 120名のエンジニアが使う Agent SDK を設計・開発する
ガードレール / ポリシー実行エンジンを構築し、エージェントの行動を安全に制御する
Research Engineer と連携し、最新の研究成果を本番基盤に統合する
●成果責任 (KR/メトリクス)
Agent SDK 採用率 (社内チームの利用率・満足度)
エージェント実行成功率 (タスク完了率、チェックポイントからのリカバリ成功率)
Harness 起因の障害率 (ガードレール突破率、状態不整合率)
実行レイテンシ P95 / P99 (Harness 層のオーバーヘッド)
推論コスト効率 (モデルルーティングによるコスト最適化)
開発者体験スコア (SDK / API の社内 NPS)
●チーム体制
約120名が開発組織に在籍しています。
Agent Harness Engineerは以下のチームを横断して活動します:
Infra — クラウドインフラ・SRE
Data — データパイプライン・分析基盤
Agent Harness — エージェント実行フレームワーク
密接に連携する役割:
Agentic Product Engineer — エージェント機能開発 (SDK のユーザー)
Research Engineer — 研究開発・新手法の基盤統合
AI QA Specialist — 評価パイプラインとの連携
Product Manager — プロダクト設計・非機能要件定義
●開発環境
言語 : Python, Go (バックエンド・基盤開発) , TypeScript / React / Next.js (フロントエンド部) / NX
インフラ : GCP (コンテナ / K8s) , Docker, Terraform
メッセージング : Kafka / Pub/Sub
監視 : Prometheus, Grafana, OpenTelemetry
ツール : Slack, Confluence, Linear, Google Workspace, GitHub, Notion
AI 開発支援 : Claude Code MAX Plan, Cursor, ChatGPT, Devin
作業環境 : Mac (Apple Silicon) , デュアルモニタ対応