癌症风险因素数据集
45.69
3 浏览
2 喜欢
6 下载
关于数据集🧬 癌症风险因素和类型(2,000 行)一个紧凑的标准化表格数据集,将生活方式、环境和遗传信号与五种癌症类型联系起来——2,000 条记录× 21 个特征,具有清晰的编码(0-10 个序数指数、BMI/年龄、BRCA、幽门螺...
数据介绍
文件下载列表
相关论文
数据使用声明
README.md
关于数据集
🧬 癌症风险因素和类型(2,000 行)
一个紧凑的标准化表格数据集,将生活方式、环境和遗传信号与五种癌症类型联系起来——2,000 条记录× 21 个特征,具有清晰的编码(0-10 个序数指数、BMI/年龄、BRCA、幽门螺杆菌)。针对 EDA、仪表板和多类 ML () 进行了优化,以及可选的复合和分层。
免责声明:此数据集仅用于研究/教育,不用于临床用途。Cancer_TypeOverall_Risk_ScoreRisk_Level
🚀 为什么选择这个数据集?
- 探索生活方式和环境暴露的风险模式
- 构建仪表板以可视化患病率和风险分布
- 训练具有干净、一致特征的多类 ML 模型
- 练习超出准确性的班级不平衡处理和评估(例如,宏 F1)
📂 包含的文件
cancer-risk-factors.csv→ 个人层面的记录(2000 × 21),有目标和特征
🎯 目标和任务
- 主要目标:∈ {, , , ,
Cancer_TypeLungBreastColonProstateSkin} - 推荐指标:宏 F1、准确性、混淆矩阵。
- 可选任务:通过源自 (0–1) 的 ∈ {, , } 进行风险分层。
Risk_LevelLowMediumHighOverall_Risk_Score - 默认阈值(示例):、、、。
Low < 0.350.35 ≤ Medium ≤ 0.65High > 0.65 - 由于不平衡(中等为多数),请考虑班级权重或分层简历。
附件列表
暂无可预览附件
暂无相关代码
数据使用声明:
一、数据来源与展示说明:
1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
二、所有权说明:
1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
三、数据转载说明:
1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
四、侵权与处理说明:
1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。