【JAPAN AI】Software Enginner, AI Platform / Japanese
Software Enginner, AI Platform / Japanese
バックエンドサービス・プラットフォーム構築
AI プラットフォームのバックエンドサービスの設計・実装・運用
Kubernetes クラスタの設計・構築・運用
クラウドインフラ (GCP) のアーキテクチャ設計・最適化
IaC (Terraform) によるインフラのコード化・自動化
コスト / 性能最適化 (オートスケーリング、キャッシュ、バッチ処理、GPU 管理)
観測性・ガバナンス
観測性基盤 (トレーシング、ログ、メトリクス) の設計・整備
AI エージェント特有のトレーシング (推論リクエストの追跡、ツール呼び出しの可視化)
データアクセス・権限管理基盤の構築
セキュリティ要件への対応
SRE・信頼性
プラットフォーム稼働率 99.9% 以上の維持
SLI / SLO の設計・運用
オンコール、インシデント対応、ポストモーテム
インシデント MTTR の継続的改善
開発者体験の向上
CI/CDパイプラインの構築・改善
開発環境・ステージング環境の整備
社内エンジニア向けのインフラドキュメント整備
【業務シナリオ例】
※以下は想定される業務シナリオの例です
● シナリオ 1: 推論パイプラインのバックエンドサービス最適化
推論リクエストの急増に伴い、バックエンドサービスのレイテンシが悪化。
リクエストパターンを分析し、キャッシュ戦略の再設計とバックエンドサービスの非同期処理化を実装。
P95 レイテンシを 40% 改善しつつ、推論コストを 20% 削減。
● シナリオ 2: エージェントトレーシング基盤の構築
AI エージェントの障害原因特定に時間がかかっている課題を解決するため、OpenTelemetry ベースのトレーシング基盤を設計・実装。
推論リクエスト → ツール呼び出し → 外部 API 連携の一連のフローを可視化し、MTTR を 50% 短縮。
● シナリオ 3: マルチテナント環境のコスト最適化
約 200 社の顧客が同時利用するマルチテナント環境で、テナントごとのリソース消費を可視化するダッシュボードを構築。
利用パターンに基づくリソース配分の最適化により、インフラコスト ($/リクエスト) を 15% 改善。
●ミッション
「企業の脳」が 24時間 365日止まらない世界を支える
AI エージェントが安全・高速・確実に動作するための共通基盤 — バックエンドサービス、実行環境、観測性、ガバナンスを設計・構築・運用し、プラットフォーム全体の信頼性とコスト効率を最大化する。
●期待する役割について
Software Engineer (AI Platform) として、バックエンドエンジニアリングの力で AI プラットフォーム全体の信頼性・パフォーマンス・コスト効率を支えていただきます。
バックエンドサービスの設計・実装・運用を担いながら、Kubernetes クラスタやクラウドインフラの最適化にも取り組む
観測性基盤 (トレーシング、ログ、メトリクス) を設計・整備し、AI エージェント特有の障害を迅速に検出・解決する
推論コスト・インフラコストの最適化により、ビジネスインパクトに直結する改善を実現する
SLI / SLO の設計・運用、オンコール、インシデント対応を通じて稼働率 99.9% を維持する
CI/CD パイプラインの構築・改善、開発環境の整備を通じて社内エンジニアの開発者体験を向上させる
●成果責任 (KR/メトリクス)
プラットフォーム稼働率 ≥ 99.9%
エージェント実行レイテンシ P95/P99
インフラコスト効率 ($/リクエスト)
開発者体験スコア (社内NPS)
インシデント MTTR ≤ 目標値
●チーム体制
約120名が開発組織に在籍しています。
AI Platform Engineerは以下のチームを横断して活動します:
Infra — クラウドインフラ・SRE
Data — データパイプライン・分析基盤
Agent Harness — エージェント実行フレームワーク
密接に連携する役割:
Agent Harness Engineer — エージェント実行基盤の設計・実装
Agentic Product Engineer — エージェント機能開発
AI QA Specialist — 評価パイプラインとの連携
Product Manager — プロダクト設計・非機能要件定義
●開発環境
言語 : Python (バックエンド) , TypeScript / React / Next.js (フロントエンド部) / NX
インフラ : GCP (コンテナ / K8s) , Docker, Terraform
メッセージング : Kafka / Pub/Sub
監視 : Prometheus, Grafana, OpenTelemetry
CI/CD : GitHub Actions
ツール : Slack, Confluence, Linear, Google Workspace, GitHub, Notion
AI 開発支援 : Claude Code MAX Plan, Cursor, ChatGPT, Devin
作業環境 : Mac (Apple Silicon) , デュアルモニタ対応