机器学习文档

2024-05-28 23:29:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我想要达到的目标是什么?

  • 我有分类数据(JSON格式),我想生成一个模型,它应该给我新的传入数据与现有分类数据的可能性。(所有现有类的可能性)。你知道吗
  • 例如,我将现有数据分为两类。tier1tier2。当我收到我想知道的新数据时,有多少%新数据与我现有的tier1tier2数据匹配!如果不匹配,只想得到0 %

我收集的样本数据

[
    {
        "type": "threat",
        "severity": "2",
        "category": "tier1"
    },
    {
        "type": "threat",
        "severity": "3",
        "category": "tier1"
    },
    {
        "type": "malware",
        "severity": "7",
        "category": "tier2"
    },
    {
        "type": "threat",
        "severity": "7",
        "category": "tier2"
    },
    {
        "type": "malware",
        "severity": "5",
        "category": "tier1"
    },
    {
        "type": "threat",
        "severity": "14",
        "category": "tier2"
    },
    {
        "type": "malware",
        "severity": "13",
        "category": "tier2"
    },
    {
        "type": "threat",
        "severity": "14",
        "category": "tier2"
    },
    {
        "type": "threat",
        "severity": "1",
        "category": "tier1"
    },
]

收到的数据和我的期望

  • 场景1: 传入数据:
{
    "type": "foo",
    "severity": "cdsb",
}

期望:tier1: 0 %, tier2: 0 %

  • 场景2: 传入数据:
{
    "type": "threat",
    "severity": "60",
}

期望:tier1: X %, tier2: Y%

还有一些问题: 1解决这个问题的最佳方法是什么? 2我在这里展示的数据只是2特性,但是真正的输入数据有更多不同类型的字段。提取特征的最佳方法是什么!你知道吗


Tags: 数据方法json目标格式type场景分类

热门问题