
智东西
编译 | ZeR0
编辑 | 漠影
智东西2月19日报道,微软研究院今日在国际顶级学术期刊Nature上发表了一项关于新型玻璃存储数据方法的突破性成果,能将信息保存至少10000年。
它证明,一块12厘米宽、2毫米厚的方形玻璃,可以存储4.8TB的数据,相当于大约200万本印刷书籍。
微软研究团队将这种基于飞秒激光玻璃直写技术的综合性归档数字数据存储技术命名为Silica,称其是“首个满足生产级存储系统所有要求的玻璃基数据存储技术”。

论文地址:https://www.nature.com/articles/s41586-025-10042-w
领导微软剑桥研究院“硅计划”(Project Silica)的计算机科学家Richard Black说,测试表明,这些数据在290摄氏度的温度下可以保存1万年,在室温下则可能保存数十倍甚至数百倍。
麻省理工学院的生物工程师Mark Bathe认为,这种“令人印象深刻”的玻璃基替代方案“原则上可以作为关键数据备份的近乎永久性归档存储”。
北京大学计算合成生物学家钱珑评价说,尽管玻璃存储方法需要专门的硬件来写入和读取数据,但该论文表明,玻璃存储已经超越了材料实验的范畴,成为一种“可部署的归档系统”。
“通过展示一个完整的系统……他们展示了这项技术如何真正革新数据中心行业。”英国南安普顿大学光电子学研究员、曾与微软合作开发玻璃存储技术的Peter Kazansky谈道。
一、数据存储需求呈爆炸式增长,磁带和硬盘不适合长期存储
微软研究院的论文显示,人类正以指数级速度产生数据,大约每3年翻一番。这些数据中有很多具有显著的个人、商业或法律价值。
大多数数字档案系统依赖于几年内就会降解的介质。磁带和硬盘都使用电磁铁对金属薄膜上的微小区域进行磁化,微小的磁体很容易失去磁性,它们大约十年后就会老化,并不适合长期数据存储。
这导致数据必须定期迁移到新的介质,而这一过程耗时、耗资且耗能巨大。
因此,寻找一种用于长期保存数字数据的替代技术至关重要。
玻璃是一种永久性数据存储材料,具有防水、耐热和防尘的特性。在玻璃上读取数据,比在硬盘上打开文件要复杂得多,但信息的安全性却高得多。
“玻璃的优点在于,一旦写入,就无法更改。一切都搞定了。”Richard Black说道,这种设备的存储无需温度控制或维护。
利用飞秒技术将数据存储在玻璃内部激光脉冲,是目前为数不多的有望实现持久、不可篡改且长寿命存储的技术之一。
这是因为这种介质本身具有热稳定性和化学稳定性,并能抵御潮气侵入、温度波动和电磁干扰。
Peter Kazansky和他的同事们开发了激光写入技术背后的物理原理,并保持着使用熔融石英制造的最耐用玻璃基数字存储介质的吉尼斯世界纪录。其方法最大限度地提高了耐用性和数据密度。
微软于2017年开始在此基础上进行研发。
二、在厨房炊具用的玻璃上存储数据,2毫米厚玻璃能存4.8TB
在最新研究中,微软研究团队开发了一种基于飞秒激光玻璃直写技术的综合性归档数字数据存储技术Silica。
“据我们所知, Silica是首个已发表的采用玻璃的存储技术,它在所有关键存储指标上均表现出色,并且是首个在写入、读取和解码过程中均展现出可靠运行能力的存储技术。”微软研究团队在论文中写道。
飞秒激光写入技术能够确保数据完整性(存储数据可无误地检索),并且采用该技术的存储系统可保证极高的数据耐久性(数据不会因故障而丢失)。
在微软的新研究之前,该技术仅适用于纯熔融石英玻璃,而这种玻璃的制造难度相对较高,且来源有限。
微软则探索了一种能够实现更快数据写入和更可靠解码的方法。与Project Silica之前的版本相比,该方法使用了更便宜、读写复杂度更低的硼硅酸盐玻璃。
研究团队利用高能激光在一块三维硼硅酸盐玻璃上压印出形变。每个形变都编码着数据,这些数据可以通过显微镜读取。
这种与厨房炊具和烤箱门所用材料相同的玻璃,很常见、易获取,因此解决了商业化的关键障碍:存储介质的成本和可用性。
为了编码信息,研究团队使用激光以极强的脉冲形式发射能量极高的光束,每次脉冲持续时间仅为几千万亿分之一秒,精准地照射玻璃表面的特定点,并控制能量大小。
据Richard Black解释,每次照射都会产生“等离子体诱导的纳米爆炸”,使玻璃发生形变,从而改变光在玻璃中的传播方式。
研究人员利用这些微小的形变来写入数据,然后使用显微镜读取数据,显微镜能够捕捉到光在穿过每个点时行为的变化。
新技术改进显著,能够在一块12厘米见方、仅2毫米厚的玻璃中存储301层数据,实现了1.59Gbit/mm³的数据密度,存储容量达4.8TB。
所展示的写入方案实现了每束激光25.6Mbit/s的写入吞吐量(受限于激光重复频率),能量效率为每比特10.1nJ。
以前玻璃读取器需要3或4个摄像头,而现在只需要1个摄像头,从而降低成本并缩小尺寸。
此外,写入设备所需的部件更少,使其更易于制造和校准,并能更快地编码数据。

▲用于从玻璃中读取数据的研究级读取器
三、两种新型玻璃数据写入方式,实现数据存储超过10000年
微软研究团队展示了两种基于双折射体素和相位体素的新型玻璃数据写入方案。这两种方案均能最大限度地利用激光,最大限度地减少写入每个体素所需的脉冲数,从而实现高写入吞吐量、高能效和高密度。
全自动化的写入硬件、读取硬件和解码流程使其能够在数十亿个体素的规模下验证关键结果的稳健性。
该团队通过使用FEC完全恢复用户数据证明了Silica是一种可行的存储系统,并通过加速老化实验表明,数据在室温下可保存超过10000年。

▲特写镜头展示了写入器在激光脉冲上进行高速多光束数据编码
1、双折射体素写入进展
对于之前在熔融石英玻璃中使用双折射(即偏振)体素的数据存储方式,微软团队开发了一种技术,将形成体素所需的脉冲数从多个减少到仅2个,关键在于证明了第一个脉冲偏振对最终形成的体素的偏振并不重要。
该团队进一步实现了伪单脉冲写入。在伪单脉冲写入中,单个脉冲在设定其偏振后可以被分成两路,同时形成一个体素的第一个脉冲(该体素的偏振无关紧要)和另一个体素的第二个脉冲(该体素的设定偏振很重要)。
微软团队演示了如何利用这种伪单脉冲写入技术,通过光束扫描实现介质上的快速写入。
2、相位体素,一种新型存储方法
微软团队发明了一种新型的玻璃数据存储方式,称为相位体素。
在这种存储方式中,改变的是玻璃的相位变化,而非偏振,并且仅需单个脉冲即可生成一个相位体素。
其研究证明,这种相位体素也可以在硼硅酸盐玻璃中形成,并设计了一种从这种材料中编码的相位体素中读取相位信息的技术。
这项研究还证明,利用机器学习分类模型可以有效缓解相位体素中显著更高的三维符号间干扰。
3、并行写入能力
通过将玻璃内部预热和后热的数学模型与多光束传输系统的发明相结合,微软团队证明了可在玻璃内部同时写入多个相邻的数据体素,从而显著提高写入速度。
其论文阐述了一种利用光发射(体素形成过程中的副产品)进行静态校准和动态控制的方法,以全面支持自动写入操作。
4、优化和寿命测试
微软研究团队开发了一种利用机器学习优化符号编码的新方法,以及一种更好地理解在评估新型数字存储系统时错误率、错误保护和错误恢复之间权衡关系的方法。
此外,该团队还创建了一种新的非破坏性光学方法。为了识别玻璃内部数据存储体素的老化情况,他们采用了这种方法以及标准的加速老化技术,以支持保存长达10000年的数据。
其研究扩展了行业标准的格雷码,使其适用于非2的幂次方数量的符号。
结语:光存储方法有望延长数据存储期限
光存储方法,特别是激光写入玻璃等坚固介质的技术,已成为极具前景的替代方案,有望延长数据保存期限。
微软研究院的新研究介绍了一种基于飞秒激光直接写入玻璃的光归档存储技术,能够满足归档存储的实际需求。其结果表明,Silica有望成为数字时代的归档存储解决方案。
未来,随着读写解码硬件、机器学习模型以及关键组件的商品化进程不断推进,Silica可从中受益。底层技术尤其是飞秒激光器的进步,将推动该技术的进一步发展。
来源:Nature,微软博客