
IBM Research、Samsung AI、メリーランド大学ボルチモア郡の研究者によって開発された AI 科学者である AI-Descartes は、ラングミュアの気体挙動方程式やケプラーの惑星運動の第 3 法則など、ノーベル賞を受賞した研究の重要な部分を再現しました。 国防総省高等研究計画局 (DARPA) によってサポートされている AI システムは、シンボリック回帰を利用して、データに適合する方程式を見つけます。その最も特徴的な機能は、その論理的推論能力です。 これにより、AI-デカルトは、どの方程式が背景の科学理論に最も適合するかを判断できます。 このシステムは、ノイズの多い現実世界のデータと小さなデータ セットで特に効果的です。 チームは、新しいデータセットの作成とコンピューターのトレーニングに取り組んでおり、科学論文を読んで背景理論を構築し、システムの機能を改良および拡張しています。
このシステムは、ケプラーの惑星運動の第 3 法則、アインシュタインの相対論的時間膨張の法則、およびラングミュアのガス吸着方程式に優れていることを示しました。
新しい AI 科学者である AI-デカルトは、正確な方程式を見つけるために、論理的推論と記号回帰を使用してノーベル賞を受賞した作品を再現することに成功しました。 このシステムは、背景理論の構築を自動化することを含む将来の目標で、現実世界のデータと小さなデータセットで効果的です。
1918 年、アメリカの化学者 Irving Langmuir は、固体表面に付着する気体分子の挙動を調べた論文を発表しました。 慎重な実験の結果と、固体はガス分子が充填するための個別の場所を提供するという彼の理論に基づいて、彼は、圧力が与えられたときにガスがどれだけ付着するかを表す一連の方程式を導き出しました。
約 100 年後の今、IBM Research、Samsung AI、およびメリーランド大学ボルチモア郡 (UMBC) の研究者によって開発された「AI 科学者」が、ラングミュアのノーベル賞受賞作品の重要な部分を再現しました。 このシステム (科学者として機能する人工知能 (AI)) は、ケプラーの惑星運動の第 3 法則も再発見しました。この法則は、ある宇宙物体が別の宇宙物体を隔てる距離を考慮して周回するのにかかる時間を計算し、アインシュタインの相対論的時間の適切な近似値を生成しました。 -膨張の法則。高速で移動するオブジェクトの時間が遅くなることを示しています。
この研究は、国防高等研究計画局 ( 国防高等研究計画局) によって支援されました ([{” attribute=””>DARPA). A paper describing the results will be published today (April 12) in the journal Nature Communications.
A machine-learning tool that reasons
The new AI scientist—dubbed “AI-Descartes” by the researchers—joins the likes of AI Feynman and other recently developed computing tools that aim to speed up scientific discovery. At the core of these systems is a concept called symbolic regression, which finds equations to fit data. Given basic operators, such as addition, multiplication, and division, the systems can generate hundreds to millions of candidate equations, searching for the ones that most accurately describe the relationships in the data.
AI-Descartes offers a few advantages over other systems, but its most distinctive feature is its ability to logically reason, says Cristina Cornelio, a research scientist at Samsung AI in Cambridge, England who is first author on the paper. If there are multiple candidate equations that fit the data well, the system identifies which equations fit best with background scientific theory. The ability to reason also distinguishes the system from “generative AI” programs such as ChatGPT, whose large language model has limited logical skills and sometimes messes up basic math.
“In our work, we are merging a first-principles approach, which has been used by scientists for centuries to derive new formulas from existing background theories, with a data-driven approach that is more common in the machine learning era,” Cornelio says. “This combination allows us to take advantage of both approaches and create more accurate and meaningful models for a wide range of applications.”
The name AI-Descartes is a nod to 17th-century mathematician and philosopher René Descartes, who argued that the natural world could be described by a few fundamental physical laws and that logical deduction played a key role in scientific discovery.
Suited for real-world data
The system works particularly well on noisy, real-world data, which can trip up traditional symbolic regression programs that might overlook the real signal in an effort to find formulas that capture every errant zig and zag of the data. It also handles small data sets well, even finding reliable equations when fed as few as ten data points.
One factor that might slow down the adoption of a tool like AI-Descartes for frontier science is the need to identify and code associated background theory for open scientific questions. The team is working to create new datasets that contain both real measurement data and an associated background theory to refine their system and test it on new terrain.
They would also like to eventually train computers to read scientific papers and construct the background theory themselves.
“In this work, we needed human experts to write down, in formal, computer-readable terms, what the axioms of the background theory are, and if the human missed any or got any of those wrong, the system won’t work,” says co-author Tyler Josephson, assistant professor of Chemical, Biochemical and Environmental Engineering at UMBC. “In the future,” he says, “we’d like to automate this part of the work as well, so we can explore many more areas of science and engineering.”
This goal motivates Josephson’s research on AI tools to advance chemical engineering.
Ultimately, the team hopes their AI-Descartes, like the real person, may inspire a productive new approach to science. “One of the most exciting aspects of our work is the potential to make significant advances in scientific research,” Cornelio says.
Reference: “Combining Data and Theory for Derivable Scientific Discovery with AI-Descartes” 12 April 2023, Nature Communications.
DOI: 10.1038/s41467-023-37236-y
Funding: Defense Advanced Research Projects Agency