考研 数据结构(考研数据结构参考)




考研 数据结构,考研数据结构真题

Eccentric intervolved, yet regular

Then most, when most irregular they seem,

And in their motions harmony divine

— From “Lost Paradise”

John Milton [英](1608-1674)

错综、纵横、迂回,如入迷阵,

看似最不规则,却是超过寻常整齐的规律。

它们的动作合乎神的谐调

——节选《失乐园》

译:朱维之(1905-1999)

提出问题

在紊乱状态数据中,是否潜藏着内在秩序?若答案为“是”,内在秩序为何?

——若数据源自真实世界,而非人为构造,数据中必携带真实信息。

——自然科学研究所秉承的信念:世界是规则的,并可以被认识。这不是被证明的真理,也不是被提出的猜想,毋宁是一种信仰,一种作为认知主体的人最好采取也不得不采取的观点。

——因此,数据中必潜藏着内在秩序。

至此,回答了第一问。第二问由浙江大学力学系王永副教授课题组和西湖大学工学院姜汉卿教授课题组作答,文章近期发表于Journal of Mechanics and Physics of Solids (DOI: https://doi.org/10.1016/j.jmps.2022.105127)。

具体而言,细看图1所示状态数据序列(来自随机激励的耗散的杜芬振子),不知系统为何,不知激励为何,亦不知耗散为何,只知这组状态数据,旨在从中抽取内禀结构。如何操作?

图1. 紊乱状态数据(随机激励的耗散的杜芬振子)

澄清问题

首先澄清两个问题:其一,提法本质区别于数据驱动的系统方程识别;其二,提法是迫不得已,而非一场数学游戏。

数据驱动的系统方程识别方法,近几年来取得长足进展。隐式方法以神经-常微分方程(NN-ODE)1为代表,而显式方法以稀疏回归为代表。鉴于后者的可解释性,并行发展了微分格式2、积分格式、微分弱形式和变分格式3识别,旨在降低导数阶次,提高算法的噪声鲁棒性。然而,所有这些,都要求同时提供响应数据和激励数据,除非系统自治(无激励),因此,本质上都难逃数据拟合的窠臼。此处提法不同,不是在响应和激励之间寻找关系,而是一个更根本的问题:仅从响应中抽取知识。

此处的提法中,仅有紊乱的状态数据而无激励数据——这不是强制构造问题,不是一场数学游戏,而是迫不得已而为之。对复杂开放系统(如物理系统、生命系统和工程结构等)而言,激励时间演化和空间分布错综复杂(如热扰动、生物电扰动、风载荷等),需用随机过程甚至随机场来描述,这就使得,获取激励数据十分困难,甚至是完全不可能的,能获得的只有我们所关注的响应数据罢了。但是,认识的脚步必将勇往直前:一条路是从工具着手,发展更为卓越的检测工具和检测方案;另一条路是从算法着手,看看从仅有的状态数据中,能得到什么?此处沿后一路径行进。

解决问题

内禀(保守)结构是人们(认知主体)赋予真实对象(认知客体)的一种属性,因此,必须首先在系统中植入结构(机器学习中称为归纳偏置)。从物理角度看,有三种结构可供选择:拉格朗日结构、哈密顿结构和积分变分结构,三者以拉格朗日-达朗贝尔原理为共同基础,在数学上具有等价性。然而,数学等价性并不意味着操作等价性,三者各有利弊,此处选择植入拉格朗日结构。问题转换为:仅从紊乱状态数据出发,抽取系统拉格朗日量。

此处以正交性操作为核心,提出3E程式(embeding,植入结构;eliminating,消除非保守;extracting,抽取保守结构)处理之。所谓正交性操作,即引入核函数,使之与非保守部分正交,从而消去非保守影响。消除非保守和识别保守结构同步进行,同步确定核函数和拉格朗日量,执行流程图2所示。

图2. 3E执行流程+正交性操作

正交性操作的几何意义:引入核函数,调整各向量(各元素相应于不同时刻)的空间几何关系,使相应于非保守部分的向量尽可能与矩阵列空间正交(详见原文)。正交性操作具有更深刻的物理内涵:即,选择恰当的广义坐标变分使之在广义坐标空间中与非保守力正交。

上述方法已成功应用于典型力学系统的识别,如图3所示,给出了杜芬振子、车摆系统和欧拉-伯努利梁的拉格朗日量/拉格朗日密度的识别结果。

图3. 识别结果(杜芬振子,车摆系统,欧拉-伯努利梁)

相关工作

相关工作有二。其一为麻省理工学院Tegmark教授4(《Life 3.0》一书的作者)的工作,他们仅从状态数据出发识别新物理(如各类耗散行为);其二为牛津大学Desai教授5的工作,他们更为雄心勃勃,仅从状态数据出发同时识别系统的哈密顿量、耗散行为和外部激励!二者都是在神经网络框架下进行的,显著区别于本文的显式方法;二者都未涉及复杂的随机激励问题;后者更是涉嫌从局部信息推理全局信息。本文则强调内禀结构和紊乱数据,与二者可相互借鉴,相互促进。

有何用处

理论价值在于:系统内禀(保守)结构具有根本的重要性,一旦获得,其余的都只是枝节罢了。潜在应用场景众多,略举几例:得到了系统内禀保守结构,即可随时、随意调控系统平衡点性态、个数和位置;得到了系统内禀保守结构,也就知道了隐藏于数据中的慢变过程,据此可展开系统的降维处理,即给出慢变信息满足的低维系统方程描述。

这项工作6第一作者为浙江大学力学系博士研究生黄展超,现在西湖大学工学院从事博士后研究工作。

参考文献:

[1] Chen, T.Q., Rubanova, Y., Bettencourt, J., Duvenaud, D.K., 2018. Neural ordinary differential equations. Adv. Neural Inf. Process. Syst. 31, 6571–6583.

[2] Brunton, S., Proctor, J., Kutz, J., 2015. Discovering governing equations from data: sparse identification of nonlinear dynamical systems. Proc. Natl. Acad. Sci. 113, 3932–3937.

[3] Huang, Z.L., Tian, Y.P., Li, C.J., Lin, G., Wu, L.L., Wang, Y., Jiang, H.Q., 2020. Data-Driven Automated Discovery of Variational Laws Hidden in Physical Systems. J. Mech. Phys. Solids 137, 103871.

[4] Liu, Z., Wang, B., Meng, Q., Chen, W., Tegmark, M., Liu, T.-Y., 2021. Machine-learning nonconservative dynamics for new-physics detection. Phys. Rev. E 104, 55302.

[5] Desai, S.A., Mattheakis, M., Sondak, D., Protopapas, P., Roberts, S.J., 2021. Port-Hamiltonian neural networks for learning explicit time-dependent dynamical systems. Phys. Rev. E 104, 34312.

[6] Huang, Z.C., Huang, S.H., Li, J.Y., Wang, Y., Jiang, H.Q., 2023. Extracting conservative equations from nonconservative state data, J. Mech. Phys. Solids 170, 105127.

考研 数据结构(考研数据结构参考)

未经允许不得转载:上海考研网 » 考研 数据结构(考研数据结构参考)

赞 (0) 打赏

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏