BAXKO 医学模型開發手冊 03
3.1 数据
A 数据安全
从数据集中去除个人身份信息(PII),确保个人记录无法追溯到特定个人。
将单个数据点组合成分组摘要,降低识别特定个体的风险。
生成模拟原始数据的属性和模式的人工数据,但不包含任何真实的个体信息。
在数据中添加噪声以确保个人隐私受到保护,同时仍允许进行有用的分析。该方法提供了一种可量化的隐私保护措施。
不是共享原始数据,而是在每个数据所有者的设备上本地训练 AI 模型,并仅共享模型更新。这种方法可确保敏感数据永远不会离开设备。
这种加密技术使多方能够联合计算其输入的函数,同时保持输入的私密性。
以无需先解密即可用于计算的方式对数据进行加密,从而允许 AI 模型在加密数据上进行训练。
建立具有法律约束力的协议并实施技术访问控制,以限制数据的使用并确保其仅用于约定的目的。
百科专有数据安全验证系统,可快速使用验证数据集验证数据安全性。
可以快速验证数据安全性的算法,目前正在测试。
通过结合使用这些技术,您可以保护数据的安全,同时仍将其提供给其他人进行 AI 训练。必须仔细考虑每种情况的具体要求和风险,以确定最合适的方法。
B 数据提供给第三方的风险