⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验
2025-08-23 更新
Sadeed: Advancing Arabic Diacritization Through Small Language Model
Authors:Zeina Aldallal, Sara Chrouf, Khalil Hennara, Mohamed Motaism Hamed, Muhammad Hreden, Safwan AlModhayan
Arabic text diacritization remains a persistent challenge in natural language processing due to the language’s morphological richness. In this paper, we introduce Sadeed, a novel approach based on a fine-tuned decoder-only language model adapted from Kuwain 1.5B Hennara et al. [2025], a compact model originally trained on diverse Arabic corpora. Sadeed is fine-tuned on carefully curated, high-quality diacritized datasets, constructed through a rigorous data-cleaning and normalization pipeline. Despite utilizing modest computational resources, Sadeed achieves competitive results compared to proprietary large language models and outperforms traditional models trained on similar domains. Additionally, we highlight key limitations in current benchmarking practices for Arabic diacritization. To address these issues, we introduce SadeedDiac-25, a new benchmark designed to enable fairer and more comprehensive evaluation across diverse text genres and complexity levels. Together, Sadeed and SadeedDiac-25 provide a robust foundation for advancing Arabic NLP applications, including machine translation, text-to-speech, and language learning tools.
阿拉伯文本变音标记处理仍是自然语言处理领域的一大挑战,因为该语言具有形态丰富的特点。在本文中,我们介绍了Sadeed,这是一个基于精心微调解码器的新方法,源于Kuwain语言模型第二代的压缩版本——基于强大网络集成的版本(Hennara等, 预测的版本将),这种模型最初是在各种阿拉伯语料库上训练的。Sadeed在精心挑选的高质量变音数据集上进行微调,这些数据集是通过严格的数据清理和标准化管道构建的。尽管使用的计算资源相对有限,但Sadeed在与专有大型语言模型的竞争中取得了不俗的结果,并且表现优于在类似领域训练的模型。此外,我们指出了当前阿拉伯变音评估方法的局限性和不足之处,并为了解决这个问题引入了SadeedDiac-25新评估标准,它能够更全面和公平地评估不同文本类型和复杂度的模型性能。总之,Sadeed和SadeedDiac-25为推进阿拉伯语自然语言处理应用提供了坚实的基础,包括机器翻译、文本到语音转换和语言学习工具等。
论文及项目相关链接
Summary
本文介绍了Sadeed,一种基于Kuwain 1.5B Hennara等人在2025年开发的新型阿拉伯语解码器语言模型的新方法。通过在高质量阿拉伯文字数据集的精细化训练,Sadeed模型能够在适度的计算资源下取得良好的阿拉伯语文字化成绩,与其他大型专有语言模型相比也有竞争优势。同时,本文强调了当前阿拉伯语文字化基准测试方法的局限性,并提出了SadeedDiac-25基准测试来更全面公平地评估不同文本类型和复杂度的表现。Sadeed和SadeedDiac-25为推进阿拉伯语NLP应用提供了坚实的基础,包括机器翻译、文本转语音和语言学习工具。
Key Takeaways
- 介绍了一种名为Sadeed的新型阿拉伯语语言模型方法,适用于文字化任务。
- Sadeed是基于Kuwain 1.5B Hennara等模型构建的,经过了精心选择和整理的高质量阿拉伯语数据集训练。
- 与其他大型语言模型相比,Sadeed在资源有限的情况下表现出竞争力。
- 当前阿拉伯文字化的基准测试存在局限性,需要更全面和公平的评估方法。
- 提出了一个新的基准测试SadeedDiac-25,旨在全面评估不同文本类型和复杂度的表现。
- Sadeed和SadeedDiac-25的提出为推进阿拉伯语NLP应用如机器翻译、文本转语音和语言学习工具提供了坚实的基础。
点此查看论文截图




Tensor Train Decomposition for Adversarial Attacks on Computer Vision Models
Authors:Andrei Chertkov, Ivan Oseledets
Deep neural networks (DNNs) are widely used today, but they are vulnerable to adversarial attacks. To develop effective methods of defense, it is important to understand the potential weak spots of DNNs. Often attacks are organized taking into account the architecture of models (white-box approach) and based on gradient methods, but for real-world DNNs this approach in most cases is impossible. At the same time, several gradient-free optimization algorithms are used to attack black-box models. However, classical methods are often ineffective in the multidimensional case. To organize black-box attacks for computer vision models, in this work, we propose the use of an optimizer based on the low-rank tensor train (TT) format, which has gained popularity in various practical multidimensional applications in recent years. Combined with the attribution of the target image, which is built by the auxiliary (white-box) model, the TT-based optimization method makes it possible to organize an effective black-box attack by small perturbation of pixels in the target image. The superiority of the proposed approach over three popular baselines is demonstrated for seven modern DNNs on the ImageNet dataset.
深度神经网络(DNNs)目前应用广泛,但它们容易受到对抗性攻击的影响。为了开发有效的防御方法,了解DNNs的潜在弱点非常重要。通常的攻击会考虑到模型的架构(白盒方法)并基于梯度方法,但在实际应用中,对于真实世界的DNNs,这种方法在大多数情况下是行不通的。同时,一些无梯度优化算法被用于攻击黑箱模型。但在多维情况下,经典方法往往效果不佳。为了对计算机视觉模型进行黑箱攻击,本文提出了基于低秩张量列车(TT)格式的优化器的使用,该格式在近年来的各种实际多维应用中已经广受欢迎。结合由辅助(白盒)模型构建的目标图像属性,基于TT的优化方法通过目标图像中像素的小扰动来组织有效的黑箱攻击成为可能。在ImageNet数据集上的七个现代DNN上,所提出的方法优于三个流行的基线方法。
论文及项目相关链接
摘要
深度神经网络(DNN)易受对抗性攻击,为了开发有效的防御方法,了解其潜在弱点至关重要。虽然针对模型架构的白盒攻击和基于梯度的方法常被用于攻击,但在现实世界的DNN中,这种方法大多不可行。同时,针对黑盒模型的梯度无关优化算法也被使用,但经典方法在多维情况下往往无效。本研究提出使用基于低秩张量列车(TT)格式的优化器来组织计算机视觉模型的黑盒攻击。结合由辅助白盒模型构建的靶标图像属性,TT优化方法通过轻微扰动靶标图像像素,实现了有效的黑盒攻击。在ImageNet数据集上的七个现代DNN上,所提出的方法优于三个流行的基线方法。
要点
- 深度神经网络(DNN)易受对抗性攻击,需了解潜在弱点以开发有效防御方法。
- 白盒攻击和基于梯度的攻击方法在现实世界的DNN中不可行。
- 针对黑盒模型的梯度无关优化算法存在,但经典方法在多维情况下效果不佳。
- 提出使用基于低秩张量列车(TT)格式的优化器进行黑盒攻击。
- 结合靶标图像属性,通过轻微扰动像素实现有效黑盒攻击。
- 在ImageNet数据集上的实验表明,该方法优于三个流行的基线方法。
- 该研究为抵御DNN对抗性攻击提供了新的思路和方法。
点此查看论文截图


