- 正社員
株式会社ジーニー
AI 機械学習エンジニア
最先端技術で顧客価値を創造!市場価値を高める
年俸8,000,000円~16,000,000円
この求人は職業紹介事業者による紹介案件です
応募情報は職業紹介事業者に送信されます
仕事内容
【<JAPAN AI>AI Evaluation Scientist】AIプロダクトを牽引/様々なサービス展開/多国籍企業でグローバルな働き方/赴任旅費やリフレッシュ手当などの福利厚生充実/グループ企業唯一の0から立ち上 AI・機械学習エンジニア 東京都新宿区西新宿6-8-1住友不動産新宿オークタワー 5/6階 正社員 求人の特徴 土日祝休み 業務内容 【募集背景】 JAPAN AIは「JAPAN AI AGENT / CHAT / SPEECH」をはじめとするエンタープライズ向けAIエージェント群を急速に拡大しています。プロダクトの中核がLLM / マルチエージェントへ移行する中、AI出力の品質・安全性・信頼性を科学的に評価する専門組織を新設します。 【業務内容】 AI Evaluation Scientistとして、 *AIエージェントの評価基盤 (Evaluation Infrastructure)* の設計・構築・運用をリードしていただきます。 ・評価メトリクスの研究開発 LLM-as-Judge の校正手法の研究・実装 (rubric 設計、バイアス検出、proper scoring rules) 評価ベンチマークの設計・構築・妥当性検証 (construct validity、contamination detection) 報酬モデリング / preference learning の評価への応用研究 評価メトリクスの選定・設計 (win rate、task success、factuality、harm detection) 評価セット (合成データ + 実ログ) の設計・構築・メンテナンス ・自動評価パイプラインの設計・構築 スケーラブルな自動評価パイプラインの設計・実装 CI/CD への評価パイプライン組込みと品質ゲートの構築 エージェント評価ハーネスの設計 (マルチターン・ツール利用・ロングコンテキスト対応) 評価パイプラインの再現性・信頼性の担保 ・安全性・品質検証 自動レッドチーミング (automated adversarial testing) の研究・実装 安全性 / ポリシー準拠の検証フレームワーク構築 ハルシネーション検出・校正手法の研究・実装 プロンプト / ツール回帰テストの設計・実行 ・統計分析・実験設計 統計的実験計画 (A/B テスト、有意差検定) の設計・分析 品質トレンドの可視化・回帰検出の自動化 品質レポート作成と改善提案 評価シグナルの研究・開発チームへのフィードバック 【このポジションの魅力】 ・Evaluation Science の実践 : Apple・Anthropic・Scale AI・Google DeepMind 等が注力する「AI 評価科学」を、日本のエンタープライズ AI の文脈で実践できます。評価手法そのものを研究対象とする、世界的にも希少なポジションです ・ML/DS スキルの新しい応用 : 機械学習・統計学の専門性を「モデル開発」ではなく「モデル評価」に応用します。報酬モデリング、LLM-as-Judge の校正理論、ベンチマーク設計など、研究と実装の両面で知的挑戦があります ・品質がプロダクトの信頼を決める : 約200社が利用する本番環境で、あなたが構築した評価基盤がリリース品質の最後の砦になります。品質保証がビジネスインパクトに直結する手応えを実感できます ・新設ポジション : AI エージェントの品質評価科学という新しい専門領域を、ゼロから設計・構築できます。評価メトリクスの研究開発から自動評価パイプラインの本番実装まで、大きな裁量を持って取り組めます ・AI安全性の最前線 : 自動レッドチーミング、adversarial testing、ポリシー準拠検証など、Responsible AI の実践に携われます。AI エージェントが「企業の脳」として業務を自律実行する世界で、安全性を科学的に保証する役割を担います ・急成長環境 : 設立3年で200名以上の規模、9プロダクト展開のスタートアップで、技術的意思決定に大きな裁量を持てます。Research Engineer や Agent Harness Engineer と密接に連携し、プロダクト全体の品質に影響を与えるポジションです ※本求人は、株式会社キッカケクリエイションによる職業紹介での求人ご紹介となります 職種 AI・機械学習エンジニア 雇用形態 正社員 勤務体系 固定時間制 リモートワーク制度 ハイブリッドリモート
対象となる方
求める人物像 ■必須条件 ・コンピュータサイエンス、ソフトウェア工学、人工知能、機械学習、数学、物理、計量心理学などの関連分野における修士号以上、または同等の実務経験 ・MLエンジニア / DS / リサーチエンジニア / ML評価関連職種の実務経験 3年以上 ・LLM / 生成AIの評価手法に関する深い知識 統計学・実験計画法の実践的知識 ・Pythonでの ML / 評価パイプライン構築経験 ・機械学習フレームワーク(PyTorch, JAX, TensorFlow等)の実務経験 ・評価メトリクスの設計・実装経験 ・言語レベル : いずれか必須 日本語 : Fluent (プロダクト開発において齟齬なく議論を行えるレベル) 英語 : ビジネスレベル 本ポジションはAI出力の評価科学(Evaluation Science)を担う研究開発職です。MLモデル評価・LLM評価における研究または実装経験を必須としています。 ■歓迎要件 ・ML / NLPトップカンファレンス(NeurIPS, ICML, ICLR, ACL, EMNLP等)での論文発表経験 ・報酬モデリング / preference learning(RLHF, DPO等)の研究・実装経験 ・LLM-as-Judge の校正・rubric設計の経験 ・AI安全性・Responsible AI・レッドチーミングに関する知識・経験 ・ベンチマーク設計・妥当性検証(IRT, construct validity)の経験 ・マルチエージェント・ワークフロー / ツール利用 / ロングコンテキストの評価経験 ・大規模データ処理(Spark / BigQuery等)の経験 ・CI/CDパイプラインへのML/評価パイプライン組込み経験 ・論文読解・再現実装の能力 ・英語での技術コミュニケーション能力
仕事の特徴
- 固定時間制
- 土日祝休み
給与/待遇
試用期間
待遇・福利厚生
職場環境・雰囲気
勤務先従業員数 877
その他
応募情報
選考プロセス
応募書類等 履歴書、職務経歴書 選考について 書類選考 → コーディングテスト → 面接(4~5回)→ 内定 ※最終面接までにリファレンスチェックをご対応いただきます
紹介企業情報
会社名
株式会社キッカケクリエイション
事業内容
人材派遣・職業紹介
所在住所
東京都渋谷区桜丘町22番14号 N.E.Sビル N棟3階
代表者
川島 我生斗
応募に関するお問い合わせ
09082266875
会社ホームページ
いま見ている求人へ応募しよう!
年俸8,000,000円~16,000,000円
就業時間 10:00~19:00
- 土日祝休み
- 固定時間制
掲載開始日:2026/07/02
原稿ID:757bd4b34dff6d33
他の条件で探す
勤務地
職種
特徴
東京都
東京23区
東京都新宿区
新宿駅(東京都)
新大久保駅(東京都)
高田馬場駅(東京都)
四ツ谷駅(東京都)
大久保駅(東京都)
信濃町駅(東京都)
西武新宿駅(東京都)
下落合駅(東京都)
中井駅(東京都)
新線新宿駅(東京都)
四谷三丁目駅(東京都)
新宿御苑前駅(東京都)
新宿三丁目駅(東京都)
西新宿駅(東京都)
落合駅(東京都)
早稲田駅(東京都)
神楽坂駅(東京都)
西早稲田駅(東京都)
東新宿駅(東京都)
都庁前駅(東京都)
新宿西口駅(東京都)
若松河田駅(東京都)
牛込柳町駅(東京都)
牛込神楽坂駅(東京都)
国立競技場駅(東京都)
西新宿五丁目駅(東京都)
落合南長崎駅(東京都)
曙橋駅(東京都)
面影橋駅(東京都)
早稲田駅(東京都)
雇用形態
キーワード