Pyspark NLP - CountVectorizer最大DF或TF。如何从数据中过滤常见的出现。我使用CountVectorizer为ML准备一个数据集。我想过滤掉稀有单词,并使用CountVectorizer、minDF或minTF的参数。我还想删除数据集中“经常”出现的项。我看不到可以设置的 ...2024-05-24 已阅读: n次