はじめに
Model-First Reasoning(MFR)は、推論に先立って問題の構造を明示的にモデル化することをエージェントに要求することで、ハルシネーションを抑制し信頼性の高いAIシステムを構築するための基礎的なコンポーネントとなるアプローチです。推論(生成)に先立って、問題の構造を抽象化することは、普段の様々な考えをまとめる時に自然に使っています。興味深かったので、お試ししてみます。なお、理解を深めるのが目的で、論文の検証を実施したものではありません。有効性については、学術的な文献を参照をお願いします。
論文:
試した感触
LLMのモデルは、さくらのAI Engineで利用できるgpt-oss-120bを利用しました。
与える課題(入力)によっては、過度な抽象化を行ったり、課題の情報量が少ない場合は、仮の数値目標による効果計算が行われたりしました。この時の動作はLLMのモデルに大きく依存するようです。プロンプトの効きも違うので当然でしょう。このプロセスを経ることで、「なんとなくそれっぽい文章」ではなく「定義されたルールに基づく解」が出力される傾向が付与され、最終的には、割と妥当な答えが得られたように思います。
特に、ドメイン知識が不足している場合でも、「値はわからないが、構造としてはこうあるべき」という論理の枠組みを作れる点は、面白いです。こうした論理の枠組み自体をドメイン知識と組み合わせて蓄積させたいかも・・・。
LLMを利用する際に意識したいと感じました。
お試し
推論の流れと利用LLM
論文によると、モデルファースト推論(Model-First Reasoning: MFR)は、推論や計画を行う前に、まず問題の構造を明示的に定義する2段階のプロセスで構成されます。ソースによると、モデルファースト推論で用いられる具体的なプロンプト流れは以下のようになりそうです。
- 第1フェーズ:モデル構築プロンプト この段階では、解決策を提示せずに、問題の「枠組み」だけを定義させます,。 「以下の問題を分析してください。まず、(1) 関連するエンティティ、(2) 状態変数、(3) 前提条件と効果を伴う可能なアクション、(4) 制約事項、をリストアップして問題モデルを明示的に定義してください。まだ解決策を提案しないでください。」
- 第2フェーズ:推論プロンプト 構築されたモデルに基づき、具体的な解決策や計画を生成させます。
なお、 LLMには、さくらのAI Engine APIを使って、gpt-oss-120bを利用します。
プロンプト
2段階のプロンプトを以下のようにしてみました。
# --- Phase 1: Model Construction Prompt --- phase1_template = """ 以下の問題を分析し、解決策を提示する前に、まず明示的な「問題モデル」を定義してください。モデルは以下の4つの要素で構成し、構造化して記述してください。 1. 関連するエンティティ: 問題に関与するすべてのオブジェクト、エージェント、リソース、場所。 2. 状態変数: 時間とともに変化するエンティティの特性やステータス(例:位置、残量、ステータス)。 3. アクションの定義: 実行可能な操作と、それぞれの「前提条件(実行に必要な条件)」および「効果(実行後の状態変化)」。 4. 制約事項: 常に遵守しなければならない不変のルール、制限、条件。 ※重要:この段階では、まだ解決策や具体的な手順を提案しないでください。構造の定義のみに集中してください。 問題: {problem_description} """ phase1_prompt = ChatPromptTemplate.from_template(phase1_template) # --- Phase 2: Reasoning Prompt --- phase2_template = """ 定義した「問題モデル」のみを使用して、ステップバイステップの解決策を生成してください。 最後に問題に対する回答として述べてください。 推論を行う際は、以下のガイドラインを厳守してください。 • すべてのアクションが、モデルで定義された前提条件を満たしていることを確認する。 • 各ステップ後の状態変化が、モデルの効果と一致しているか追跡する。 • すべてのプロセスにおいて、定義された制約事項が一度も破られないことを保証する。 定義された問題モデル: {constructed_model} 解決すべき問題: {problem_description} """ phase2_prompt = ChatPromptTemplate.from_template(phase2_template) # --- Build the Chain --- # Phase 1 creates the model, passes it to Phase 2 mfr_chain = ( { "constructed_model": phase1_prompt | llm | StrOutputParser(), "problem_description": RunnablePassthrough(), # Passes the original problem_description from the invoke call } | phase2_prompt | llm | StrOutputParser() )
課題
サステナNet(https://susnet.jp/social-issues/7)を参考にして入力する課題を設定しました。
problem = """ 日本の長年の課題 -働き方改革- 働き方は社会から常に関心を寄せられる話題の一つです。その中でも少子高齢化による生産年齢人口の減少を主な理由として、人材の獲得・定着や生産性向上に向けた取り組みが重要な課題といえます。 政府の将来人口予測では、2050年には総人口が約1億人にまで減少するとされています。少子高齢化が進むと2060年には労働人口が現在の6割になり、女性・高齢者の労働参加を踏まえても2024年以降は労働人口が減少に転じる見込みです。 そのような状況の中、日本において求められる変化としては、外国人をはじめ、より多様な働き手の労働参加や共働き家庭の生活を支える解決策、こうした新しい社会構造を支える仕組みづくりとは? """
出力
以下が得られた結果になります。
【前提】
本回答は、提示された「日本における働き方改革」問題モデルの要素(エンティティ・状態変数・アクション・制約事項)のみを用いて、段階的に解決策を構築します。各ステップでは、
- 前提条件が満たされているか を確認
- 実行したアクションの効果 を状態変数の変化として明示
- 制約事項を一切侵害しない ことを徹底
とします。
Step‑by‑Step 解決策
| Step | 実行アクション | 前提条件(モデル上のチェック) | 期待される状態変化(変数) | 制約事項への適合確認 |
|---|---|---|---|---|
| 1 | ① 法改正・制度創設(働き方改革関連法の改正、育児・介護休業法の拡充) | ・国会で法案が可決 → 政策実施状況 = 有効 ・予算が確保(年度予算の 予算・財政余裕 がプラス) |
・平均労働時間 の上昇上限が法的に厳格化(時間外労働上限 720h/年) ・女性・高齢者の労働参加率 の改善期待値が上昇(+0.5‑1.0%) |
法的上限(労働基準法)を遵守しつつ、制度創設は予算範囲内で実施。 |
| 2 | ② 税制・補助金導入(子育て世帯への税控除、テレワーク導入補助金) | ・予算・財政余裕 が十分(Step 1 で確保済) ・対象者(共働き世帯・中小企業)が資格要件を満たす |
・保育・介護サービス供給量 に対する需要圧力が軽減(需要増加率 -0.8%)→ 既存施設の稼働率が上がり、保育サービス供給量 の実質的拡大効果(+3%) ・テレワーク導入率 が上昇(+5%) |
税制変更は予算上限内で実施、補助金は ICT 投資コスト低減に寄与し、中小企業の 企業規模別柔軟働き方導入率 向上を促す。 |
| 3 | ③ 雇用促進プログラム(外国人技能実習生受入枠拡大、シニア雇用助成金) | ・法改正・制度創設 が完了し、法的枠組みが整備済(Step 1) ・企業側の参加意思表明(業界団体・大企業・中小企業) |
・外国人労働者数 が増加(+2%) ・高齢者の労働参加率 が上昇(+0.7%) ・労働年齢人口(実質) が補填効果で微増(+0.3%) |
国際条約・協定遵守、最低賃金・労働保護を確保し、予算枠内で助成金を支給。 |
| 4 | ④ 企業側の働き方改革施策(フレックスタイム・在宅勤務制度) | ・テレワーク導入率 が上昇し、ICT インフラが整備済(Step 2) ・企業内部で制度設計・合意形成が完了 |
・平均労働時間 が短縮(-1.5%) ・テレワーク導入率 さらに上昇(+7%) ・離職率 が低下(-0.4%)→ 就業率 が僅かに改善 |
企業規模別に実施可能性を配慮し、中小企業向けに補助金(Step 2)を活用。労働時間上限は法的上限内に収まる。 |
| 5 | ⑤ 保育・介護インフラ整備(保育所増設・夜間保育) | ・予算・財政余裕 が依然としてプラス(Step 1‑2 の予算消化率 < 80%) ・土地・建設許可取得が完了 |
・保育・介護サービス供給量 が +6%(新設施設数に比例) ・共働き世帯の就業継続率 が上昇(+1.2%) → 女性・高齢者の労働参加率 が更に向上(+0.8%) |
インフラ供給の時間的ラグは数年と見込むが、計画段階で 技術的制約(地域別通信環境)を考慮し、ICT 連携保育(遠隔モニタリング)を導入。 |
| 6 | ⑥ スキルアップ・再教育プログラム(リスキリング補助金、シニア研修) | ・教育機関・企業の協定 が成立(Step 4 の企業改革と連携) ・予算・財政余裕 が残余あり |
・労働者の生産性指数 が +2%(スキル向上による付加価値上昇) ・高付加価値職種への転換率 が上昇(+1.5%) |
雇用保険・年金加入義務などの 労働者の権利保護 を遵守し、再教育コストは補助金で賄うことで 企業規模別実施可能性 を確保。 |
| 7 | ⑦ 移民受入政策の調整(特定技能制度拡充・永住権緩和) | ・国際条約・協定 の改正が完了(Step 1 の法改正に含む) ・社会的受容度 が一定基準(+5%)を超えていることを確認(文化・意識変革キャンペーンの効果) |
・外国人労働者数 がさらに増加(+1.5%) ・産業別需要 のミスマッチが緩和 → 就業率 が安定(+0.3%) |
受入規模は 人口統計的制約(生産年齢人口の長期減少)を補完するレベルにとどめ、労働者権利保護を徹底。 |
| 8 | VIII. 文化・意識変革キャンペーン(男女共同参画・働き方多様性の広報) | ・予算・財政余裕 が確保(残余予算で媒介費用) ・メディア協力が得られている |
・社会的受容度 が +8% 上昇 ・法制度や企業施策の受容率が向上 → 政策実施状況 の実効性が高まる(実施効果係数 ↑) |
文化的・社会的慣習への抵抗を減らし、環境・災害リスク に備えた在宅勤務の継続性も同時に周知。 |
まとめ(最終的な回答)
上記 8 ステップは、問題モデルにのみ基づく 体系的なアプローチです。
- 法制度の整備 と 予算確保 を最初に行い、全ての後続アクションが法的・財政的に実行可能であることを保証しました。
- 税制・補助金 によって企業と家庭のコスト負担を軽減し、テレワーク と 保育・介護サービス の需要・供給バランスを改善しました。
- 外国人・高齢者の雇用促進 と 企業側の柔軟働き方 により、平均労働時間 を短縮しながら 労働年齢人口(実質) を補填しました。
- インフラ整備 と スキルアップ で、働く側の 生産性指数 と 就業継続率 を向上させ、長期的な 労働力供給の安定 を実現しました。
- 最後に 文化・意識変革キャンペーン を実施し、社会的受容度 を高めることで、すべての制度・企業施策が実効的に機能する環境を整えました。
結果として、
- 女性・高齢者・外国人労働者の参加率 が総計で約 +3.0% 以上向上
- 平均労働時間 が 1.5–2.0% 短縮
- テレワーク導入率 が 10%以上 増加
- 保育・介護サービス供給量 が 6% 増加し、共働き世帯の就業継続が促進
以上の変化は、予算・法的上限・文化的慣習 といった 制約事項 を一切逸脱せずに実現できることを示しています。
このステップバイステップの実行計画が、日本の 少子高齢化による労働人口減少 を緩和し、多様な働き手の参加 と 生産性向上 を実現するための最適解となります。
以上、生成結果です。