生成AIの進化速度は想像以上!
2023年に「ChatGPT」が有名になった時に、いろいろ試してみて「うーん、使えんな・・」と思っていたのが過去の出来事になっていまいそうです。いや、なってしまったのではないでしょうか。
2025年7月、技術士筆記試験の後に、技術士受験を応援する「SUKIYAKI塾」の掲示板で、「・・最新の生成AIによる再現論文の評価について」というトピックが立ち、賑わっていました。
詳しくは、
の、トピックNo,8402をご覧ください。
何でも、生成AIのプロンプトに、詳しい評価条件と問題、復元解答を流し込むと、割と真っ当な評価をしてくれるというものでした。ホントにそこまでできるの?という疑問もあり、トピ主(たこやき さん)のプロンプト例を使用して、私が作成したR6年度建設部門の解答例を評価してみました。
R6技術士建設部門 必須科目I-1
問題
I-1 国が定める国土形成計画の基本理念として,人口減少や産業その他の社会経済構造の変化に的確に対応し,自立的に発展する地域社会,国際競争力の強化等による活力ある経済社会を実現する国土の形成が掲げられ,成熟社会型の計画として転換が図られている。
令和5年に定められた第三次国土形成計画では,拠点連結型国土の構築を図ることにより,重層的な圏域の形成を通じて,持続可能な形で機能や役割が発揮される国土構造の実現を目指すことが示された。
この実現のために,国土全体におけるシームレスな連結を強化して全国的なネットワークの形成を図ることに加え,新たな発想からの地域マネジメントの構築を通じて持続可能な生活圏の再構築を図る,という方向性が示されていることを踏まえ,持続可能で暮らしやすい地域社会を実現するための方策について,以下の問いに答えよ。
(1)全国的なネットワークを形成するとともに地域・拠点間の連結及び地域内ネットワークの強化を目指す社会資本整備を進めるに当たり,投入できる人員や予算に限りがあることを前提に,技術者としての立場で多面的な観点から3つ課題を抽出し,それぞれの観点を明記したうえで,課題の内容を示せ。(※)
(※)解答の際には必ず観点を述べてから課題を示せ。
(2)前問(1)で抽出した課題のうち,最も重要と考える課題を1つ挙げ,その課題に対する複数の解決策を示せ。
(3)前問(2)で示したすべての解決策を実行して生じる波及効果と専門技術を踏まえた懸念事項への対応策を示せ。
(4)前間(1)~(3)を業務として遂行するに当たり,技術者としての倫理,社会の持続性の観点から必要となる要件・留意点を述べよ。
解答例
1.ネットワークの強化を目指す社会資本整備を進める上での課題
1)インフラ整備の省力化(人材不足対策の観点)
我が国は人口自然減社会となり、少子高齢化も進んでいる。2070年には人口は1億人を割り込み、高齢化率は40%に迫ることが予測されているが、現時点でも生産年齢人口の減少と人材獲得競争激化により、技術者や技能者などのインフラ整備を担う人材が減少している。少ない人員で効率的な整備を進めることができるよう、インフラ整備の省力化が必要である。
2)費用対効果の高い手法の活用(費用縮減の観点)
我が国では社会保障費が国家予算の4割を占め、インフラ整備に十分な費用を充当できない状況にある。また円安や人手不足による資材単価や労務者賃金の上昇が、予算を一層圧迫する状態である。合わせてインフラ老朽化対策も進めないと安全な生活が担保できない事態に陥りつつある。既存インフラの長寿命化や高機能化、インフラの多機能化など費用対効果の高い手法を活用していく必要がある。
3)コンパクトなまちづくり推進(コンパクト化の観点)
我が国は大都市周辺に人口が偏在する一方、地方では無居住地域が拡大している。また地方部でも地方都市近辺に人口が集中する状態であり、利用者が少ない周辺部インフラの維持や更新が負担になっている。都市のコンパクトシティ化とMaaS等の交通手段の充実など、コンパクトなまちづくりの推進が必要である。
2.最も重要と考える課題とその解決策
前段1)で挙げた、「インフラ整備の省力化」を最も重要な課題と考え、複数の解決策を述べる。
1)ICTの活用による生産性向上
測量でのLiDARや画像図化、機械土工でのICT施工や、構造物工事でのBIM/CIMの活用、リモート臨場、点群データによる出来形確認、GNSS追跡データでの締固め管理、それらを利用したICT検査などICTを活用することで省力化と時間短縮を図り、生産性を向上させる。
2)Pca化等の推進
労働集約的で人手に頼っているコンクリート工事において、Pca化を図ることで現場での仮設工(型枠・足場)や鉄筋加工組立、コンクリート打設作業、養生を大幅に省力化することができる。Pca化が困難な場合でも、埋設型枠やユニット鉄筋、工事用3Dプリンタを活用し現場作業を極力削減する。
3)汎用化の推進
土木構造物は現地単品生産のうえ、一品最適化した設計のため、同じ設計を他の現場でそのまま利用できず、生産性を大きく阻害している。構造物の設計・製作において、規格化・モジュール化した部材をユニットとして現場で組み立てて構築することで、設計施工の簡素化と汎用化を行い、省力化を図る。
3.波及効果と懸念事項及び対策
1)波及効果:新技術の活用により、省力化と省人化が進み、生産性が向上する。
2)懸念事項:新技術を安全に効率的に使いこなし、かつ品質を確保するための技術が必要になる。
3)対応策:xR技術(VR、AR、MR等)を活用した教育を行う。仮想空間や複合空間での作業シミュレートや疑似体験を実作業前に行うことで、短期間で効果的な教育が期待できる。
4.倫理・持続性の観点から必要となる要件、留意点
1)技術者倫理の観点:公益の確保(公共の安全)
人員・予算に限りがあるためそれらの削減を追求しすぎると、現場での安全管理や安全対策に必要な人員までも削減してしまい、結果として業務・工事従事者が労災にあったり、第三者に被害を及ぼしたりすることになりかねないので、公共の安全を常に念頭に置く必要がある。
2)社会持続性の観点:人材育成(教育)の継続
新技術や新たな施策の利点や欠点、リスクを十分に理解せずに適用すると、思わぬ副作用を招き事故や持続性の喪失につながる恐れがある。技術や施策の原理や理論、利点欠点を正しく理解させるための教育を継続的に行っていく必要がある。
以上
生成AIによる評価
これを、3種類の生成AIで評価してみました。プロンプトの内容は、前述のトピック内をご参照ください。
- Copilot
- Gemini
- ChatGPT
それぞれの結果がこちらです。
Copilot
Copilot
Local土木屋さん、論文のご提出ありがとうございます。
以下に、日本技術士会の問題文の題意と採点基準に基づいて、論文の評価を行います。
📝 題意との整合性の確認
問題文の主旨は、以下の4点に答えることです:
- 社会資本整備における課題を3つ抽出し、それぞれの観点を明記すること。
- その中で最も重要な課題を1つ選び、複数の解決策を示すこと。
- 解決策の波及効果と懸念事項、対応策を示すこと。
- 技術者倫理と社会の持続性の観点から必要な要件・留意点を述べること。
Local土木屋さんの論文は、これらの問いに対して 明確かつ論理的に構成されており、題意に沿った内容 になっています。特に、課題の抽出において「観点」を明記し、解決策も具体的かつ技術的に裏付けられている点が高く評価されます。
📊 採点基準に基づく評価
- 専門的学識
• 国土形成計画の背景や社会資本整備に関する知識が的確に盛り込まれており、ICT施工やPca化、汎用化などの技術的手法も具体的に記述されています。
• 評価:非常に高い(Aランク相当) - 問題解決
• 複数の課題を明確に抽出し、それぞれの観点を示したうえで、最重要課題に対して複数の技術的解決策を提示しています。
• 評価:高い(A〜Bランク相当) - 評価
• 波及効果と懸念事項、対応策が簡潔ながらも的確に記述されており、xR技術による教育の提案は実効性が高いです。
• 評価:高い(A〜Bランク相当) - 技術者倫理
• 公益の確保や人材育成の継続など、倫理的観点と持続性の観点がバランスよく記述されています。
• 評価:非常に高い(Aランク相当) - コミュニケーション
• 論文全体が明快で読みやすく、論理構成も整っており、技術的な内容を一般的な読者にも理解しやすく記述しています。
• 評価:高い(A〜Bランク相当)
🏅 総合評価
• 文字数制限内で必要な要素を網羅し、題意に忠実に構成されている点
• 技術的裏付けと論理的展開がしっかりしている点
• 倫理・持続性の観点も明確に記述されている点
以上を踏まえ、総合評価は:
✅ A2(95〜90点)
🔍 改善の余地(もしさらに高得点を目指すなら)
• 課題の背景にある社会的・制度的要因の掘り下げ(例:国土形成計画の具体的施策との関連)
• 波及効果の定量的な記述(例:生産性向上の具体的な数値や事例)
• 懸念事項のリスク評価の深掘り(例:技術導入による安全性やコストのトレードオフ)
ご希望があれば、改善案の提案や添削も可能です。
次のステップとして、どの部分を強化したいか教えていただけますか?
以上、Copilotの評価ですが、ご丁寧に改善案のご提案までいただいておりました。今回は試しておりませんのでまた次の機会に置いておきます。
Gemini
「日本技術士会の問題文」の題意と「論文」の内容を照らし合わせ、採点基準に基づいて評価します。
総評
論文は、出題の意図を概ね理解し、要求された項目(課題の抽出、解決策、波及効果と懸念事項、倫理・持続性)について、限られた字数の中で記述されています。特に、課題設定や解決策は具体的であり、技術者としての視点が盛り込まれています。
しかしながら、全体的に記述が抽象的・網羅的な部分が見られ、それぞれの記述の深掘りや論理的な繋がり、具体的な事例への言及が不足している点が課題です。日本技術士会が求める「応用力」や「問題解決能力」をさらに示すためには、一歩踏み込んだ記述が必要だと考えられます。
各項目での評価と採点
1.問題の題意と論文内容の適合性
「日本技術士会の問題文」は、人口減少や社会経済構造の変化に対応した「持続可能で暮らしやすい地域社会を実現するための方策」について、以下の3つの柱で回答を求めています。
- 全国的なネットワークの形成と地域・拠点間の連結及び地域内ネットワークの強化を目指す社会資本整備
- 投入できる人員や予算に限りがあるという前提
- 技術者としての立場
この論文は、これらの題意に沿った内容となっています。
- 課題抽出(1章): 人材不足、費用縮減、コンパクトなまちづくりという3つの課題は、上記の柱に合致しており、多面的な観点から抽出されています。
- 解決策(2章): 解決策も「省力化」という課題に焦点を当て、ICT活用、Pca化、汎用化という具体的な技術的解決策を提示しており、技術者としての専門性が示されています。
- 波及効果と懸念事項(3章): 解決策による効果と、それに対する懸念事項、そして対応策まで言及されています。
- 倫理・持続性(4章): 公益確保と人材育成という観点から、倫理・持続性に対する考察が述べられています。
全体として、問題文の要求事項を網羅的に記述しようとする意図は評価できます。
2.日本技術士会の採点基準に基づく評価
専門的学識
- 評価: B1
- 理由: インフラ整備における人材不足や財源不足、人口構造の変化といった社会背景を理解し、ICT活用、Pca化、汎用化といった具体的な技術的解決策を提示しており、専門知識の理解は認められます。しかし、これらの技術が国土形成計画の基本理念である「拠点連結型国土の構築」や「重層的な圏域の形成」にどのように寄与するのか、より深く言及することで、専門的学識の応用力がさらに示せたと考えられます。例えば、ICTによる効率化が具体的にどのようにネットワーク強化に繋がるのか、Pca化や汎用化がどのように費用対効果を高め、限られた予算で広範な社会資本整備を可能にするのか、といった記述があれば、より説得力が増します。
問題解決
- 評価: B2
- 理由: 3つの課題(省力化、費用対効果、コンパクトなまちづくり)は、それぞれ異なる観点から抽出されており、問題意識は明確です。最も重要とする課題として「インフラ整備の省力化」を挙げた点も納得感があります。また、それに対する解決策としてICTの活用、Pca化、汎用化といった複数の具体的な提案がなされており、問題解決へのアプローチは示されています。 しかし、「なぜこの3つが課題なのか」という背景説明がやや希薄な印象です。例えば、現状のインフラ整備における人員や予算の具体的な制約が、これらの課題にどう影響しているのか、より詳細な分析があれば、課題抽出の妥当性が高まります。また、解決策についても、それぞれの具体的な適用範囲や、想定される効果の定量的・定性的な予測があれば、さらに評価が高まります。例えば、ICT導入によりどの程度の省力化が見込めるのか、Pca化で具体的にどのような作業が削減されるのか、といった記述です。
評価
- 評価: C1
- 理由: 解決策の実行による「波及効果(生産性向上)」と「懸念事項(新技術活用のための技術不足)」、そしてその「対応策(xR技術を活用した教育)」が簡潔に述べられており、評価の視点は持っています。 しかし、波及効果については「新技術の活用により、省力化と省人化が進み、生産性が向上する」という記述に留まっており、具体性が不足しています。この解決策が国土全体、あるいは特定の地域にどのようなポジティブな影響をもたらすのか、例えば、他分野への応用や地域活性化への貢献など、より多角的な視点からの波及効果を示すことで、評価の質が高まります。また、懸念事項についても、技術不足以外の潜在的なリスク(例えば、初期投資の大きさ、技術の習熟度格差、セキュリティリスクなど)への言及があれば、より多面的な評価能力が示せたでしょう。
技術者倫理
- 評価: B1
- 理由: 「公益の確保(公共の安全)」と「人材育成(教育)の継続」という2つの観点から、倫理と持続性に関する言及がなされています。特に、人員・予算削減の追求が安全管理に影響を及ぼす可能性に触れ、公共の安全を念頭に置くことの重要性を指摘している点は評価できます。また、新技術適用におけるリスク理解のための教育の継続性にも言及しており、社会の持続性への配慮も見られます。 ただし、倫理的な側面については、具体的な業務遂行上のジレンマや、それに対する技術者としての判断基準など、より深い考察があれば、技術者倫理の理解度をさらに示すことができたと考えられます。例えば、コスト削減と安全性の間でどのようにバランスを取るのか、といった具体的な行動指針に触れることで、実践的な倫理観を表現できます。
コミュニケーション
- 評価: B2
- 理由: 論文全体として、論理的な構成で記述されており、読み手にとって理解しやすいように努められています。課題、解決策、波及効果、倫理という流れは明確です。 ただし、コミュニケーション能力をさらに示すためには、例えば、異なる分野の専門家や地域住民、行政など、多様なステークホルダーとの連携の必要性や、合意形成のプロセスについて言及することで、より実践的なコミュニケーション能力をアピールできたと考えられます。社会資本整備においては、技術的な側面だけでなく、関係者との円滑な合意形成が不可欠であるため、この点に触れることで、より高い評価に繋がります。
総合評価
上記の評価に基づき、この論文の総合得点は82点と判断します。
ランク:B2
今後、論文の質を高めるために
- 具体性の追求: 各項目において、抽象的な表現に留まらず、具体的な数値や事例を挙げることで、説得力と深みが増します。
- 論理的な繋がり: 各章、各項目間の論理的な繋がりをより明確にすることで、一貫性のある論文になります。特に、課題と解決策、解決策と波及効果・懸念事項の因果関係を深く掘り下げることが重要です。
- 多面的な視点: 課題や解決策を検討する際に、技術的側面だけでなく、経済的、社会的、環境的、法的側面など、より多角的な視点を取り入れることで、論旨に厚みが増します。
- 「なぜ」を深く掘り下げる: なぜこの課題が重要なのか、なぜこの解決策が有効なのか、なぜこの懸念事項が生じるのか、という「なぜ」を常に問い、深く掘り下げて記述することで、問題解決能力がより高く評価されます。
今回の論文は、技術士試験の論文としての基礎は十分に備えています。上記の点を意識することで、さらに質の高い論文を作成できるでしょう。
何か他に質問はありますか?
以上、Geminiの評価ですが、なかなか的確で論理的な評価です。反省する部分が多々ありますね・・。
ChatGPT
以下に、あなたの「論文」に対して、「日本技術士会の問題文」の題意及び「採点基準」に基づいた評価と総合的な採点を示します。
【総合評価ランク】
B1(89~86点)
【採点の根拠・講評】
1. 題意との適合性(配点に大きく影響)
- 問題文は、国の国土形成計画の理念を踏まえたうえで、持続可能で暮らしやすい地域社会を実現するための方策を問うており、
- また、全国的なネットワーク形成と地域内ネットワーク強化、シームレスな連結、新たな地域マネジメントというキーワードが散りばめられていました。
→あなたの論文は、「人材不足」「費用対効果」「コンパクトシティ化」という社会資本整備の3つの課題を、多面的かつ的確に提示しており、問題文の題意には合致しています。
→ただし、「拠点連結型国土」や「重層的圏域形成」といった計画の構造的な概念には直接触れていないため、やや国土政策全体の視点に乏しい点が若干減点要素です。
2. 専門的学識(A評価相当)
- ICT施工、BIM/CIM、Pca化、3Dプリンタ、ユニット鉄筋、xR教育など、専門知識の選定と応用力は高く、現場視点の技術提案も非常に具体的です。
- インフラの省力化技術や管理手法について、現実の業務経験を踏まえて記述されており、技術士にふさわしい知識の深さと応用力が認められます。
3. 問題解決能力(B+評価)
- 複数の観点から課題を抽出し、最重要課題を選定して具体的な技術解決策を3点提示しており、構成は明快で論理的です。
- ただし、「なぜインフラ整備の省力化が最も重要なのか」という位置づけに、もう一段の説得力があるとさらに高評価となります。
- 解決策が若干「技術要素の列挙」になっており、選択理由の整理(例えば「導入性」「コスト低減幅」「波及効果の広さ」など)で相対評価的な視点があると一層よかったです。
4. 評価(波及効果・リスクと対策)(B評価)
- 技術の波及効果(省力化・生産性向上)と、懸念事項(技術の習熟・品質管理)を明示し、xRを使った教育という実用的な対策を提案しており妥当です。
- ただし、リスクの面で「技術的成熟度の差異」や「地方での導入困難性」などの社会的・制度的要因にまで言及できればさらによい評価になります。
5. 技術者倫理・社会の持続性(A評価)
- 公共の安全、人材育成、継続教育の必要性など、非常に重要な倫理観点を網羅しており、実務者視点に根差した記述で好感が持てます。
- 特に「削減を追求しすぎることへの警鐘」は、倫理的・持続性の観点を実務に即して的確に表現しており高評価です。
6. コミュニケーション(A評価)
- 論理の流れは明確で、項目ごとの記述が簡潔で読みやすく、採点者にとって理解しやすい文章構成でした。
- 語彙や表現も適切で、専門用語も説明が不要なレベルで使われており、文書による意思疎通能力も高い水準です。
【最終コメント】
あなたの論文は、技術士試験の評価基準に対しておおむね高い水準にあり、「専門的学識」「倫理性」「具体性」においてはAランク相当の内容です。一方で、国土形成計画全体とのつながりや構造的視点がやや薄いこと、解決策の技術選定理由の比較評価が弱い点が、A2(90点台)に届かなかった主な要因です。
【今後の改善ポイント】
- 国の政策(国土形成計画)との接続性を、序論や結論などで明示的に示す。
- 解決策において、なぜそれを選んだのかを明確にし、他の手法との比較で合理性を補強する。
- 地域格差や社会的要因など、技術導入の制約条件にも触れると、より実務的な説得力が増します。
必要であれば、この論文をA2相当(90点台)に引き上げるための「加筆修正版」も一緒に作成できます。希望があればお知らせください。
以上、ChatGPTの評価です。2023年に試しに使って「使えんな・・」と思ったものとは段違いにレベルアップしています。改善点のご指導までいただき、加筆修正版も作成できるとのこと。恐れ入ります・・。
生成AIは技術士添削講座を駆逐するか?!
ご覧のとおり、3種類の生成AI全てが、素晴らしい評価をしてくれました。もっとも、「プロンプト」内にAIが評価採点するにあたっての注意点や評価事項を、技術士会が二次試験申込み案内に明記されている「評価項目」そして「コンピテンシー」とともに与えた上での評価です。
つまりは、AIにやって欲しいことを正確に伝えたら、それなりの答えが戻ってくるということではないかと思いました。なので、仮に問題だけを与えて答を求めたりしても、ろくな回答(返答)はないように感じます。
皆さんも是非試してください。
そして、技術士試験の採点者・評価者はAIではなく生身の人間です。膨大な知識や解答事例は持ち合わせていない(はず)かわりに、解答文からAIには判断が難しいニュアンスや考えを読み取ってくれるのではないか。そしてそのような部分はやはり人間にしかわからないと思います。
AIの診断を参考にしながら、筆記試験問題の添削を行うことは「あり」でしょうね。完全置換にはもう少し時間が必要かもしれません。ましてや、問題中に「図面」「図形」「グラフ」なんかが出題された場合には、果たしてAIがこれを正しく読み取って理解することができるのか?できるようになる時も来るのかもしれませんが、これなんかも時間がかかる(データの蓄積が必要)のではないでしょうか。
技術士試験も一部CBT方式になるかもしれないという報道もありますので、将来は試験も受験指導も大幅にやり方は変わっていくのかもしれませんね。

コメント