带有合成数据的培训机学习模型可以
在获取多样化时,减轻数据稀缺问题的问题
足够大的数据集是昂贵且具有挑战性的. 在这里我们证明
级联扩散模型可用于合成逼真的全扫描
来自人类RNA序列数据的潜在数据的图像瓷砖
肿瘤. 基因表达的改变影响了细胞的组成
生成的合成图像瓷砖中的类型, 准确保存
细胞类型的分布并维持在
批量RNA序列数据, 正如我们显示的肺腺癌, 肾脏肾
乳头状细胞癌, 宫颈鳞状细胞癌, 冒号
腺癌和胶质母细胞瘤. 鉴定的机器学习模型
生成的合成数据的性能要比训练有训练的模型更好
划痕. 合成数据可能会加速机器学习的发展
稀缺data设置中的模型,允许丢失数据
方式.