⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验
2025-09-10 更新
Slice-100K: A Multimodal Dataset for Extrusion-based 3D Printing
Authors:Anushrut Jignasu, Kelly O. Marshall, Ankush Kumar Mishra, Lucas Nerone Rillo, Baskar Ganapathysubramanian, Aditya Balu, Chinmay Hegde, Adarsh Krishnamurthy
G-code (Geometric code) or RS-274 is the most widely used computer numerical control (CNC) and 3D printing programming language. G-code provides machine instructions for the movement of the 3D printer, especially for the nozzle, stage, and extrusion of material for extrusion-based additive manufacturing. Currently, there does not exist a large repository of curated CAD models along with their corresponding G-code files for additive manufacturing. To address this issue, we present Slice-100K, a first-of-its-kind dataset of over 100,000 G-code files, along with their tessellated CAD model, LVIS (Large Vocabulary Instance Segmentation) categories, geometric properties, and renderings. We build our dataset from triangulated meshes derived from Objaverse-XL and Thingi10K datasets. We demonstrate the utility of this dataset by finetuning GPT-2 on a subset of the dataset for G-code translation from a legacy G-code format (Sailfish) to a more modern, widely used format (Marlin). Our dataset can be found at https://github.com/idealab-isu/Slice-100K. Slice-100K will be the first step in developing a multimodal foundation model for digital manufacturing.
G代码(几何代码)或RS-274是最广泛使用的计算机数控(CNC)和3D打印编程语言。G代码为3D打印机提供机器指令,特别是针对基于挤压添加的制造的喷嘴、舞台和材料挤压的运动。目前,不存在一个大型的策划CAD模型仓库,以及与它们相对应的用于添加制造的G代码文件。为了解决这一问题,我们推出了Slice-100K,这是一个首屈一指的数据集,包含超过10万个G代码文件,以及它们的曲面CAD模型、LVIS(大词汇实例分割)类别、几何属性和渲染。我们的数据集来自Objaverse-XL和Thingi10K数据集的三角网格。我们通过微调GPT-2来展示这个数据集的有用性,该数据集的一个子集用于将旧版G代码格式(Sailfish)翻译成更为现代、广泛使用的格式(Marlin)。我们的数据集可在[https://github.com/idealab-isu/Slice-100K找到。Slice-100K将是开发数字制造多模态基础模型的第一步。
论文及项目相关链接
PDF Accepted to NeurIPS 2024. For codebase, see https://github.com/idealab-isu/Slice-100K
Summary
G-code是CNC和3D打印的编程语言,用于指导机器动作。当前缺乏包含CAD模型和对应G-code文件的制造数据集。为解决此问题,我们推出Slice-100K数据集,包含超过十万份G-code文件和其相关模型信息,以及用于迁移学习的LVIS分类、几何属性和渲染等。数据集由Objaverse-XL和Thingi10K等数据集建立三角网形成,并支持对老式G-code格式的转换功能。数据集可通过GitHub获取。Slice-100K将为数字制造领域开发多模态基础模型迈出第一步。
Key Takeaways
- G-code是CNC和3D打印的主要编程语言,用于指导机器动作。
- 当前缺乏包含CAD模型和对应G-code文件的制造数据集以供迁移学习之用。为解决此问题推出了Slice-100K数据集。
- Slice-10K包含超过十万份G-code文件和三角化的CAD模型。它还包含了渲染结果,可以用于识别和解释数据。同时其也可用于特定种类的迁移学习(LVIS分类)。
点此查看论文截图




