Python中文
首页
教程
问答
标签
搜索
登录
注册
哪种关键词最能区分两类人?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个不同群体的人在搜索时使用的关键字数据库。 比如:</p> <pre><code>group1person1: x, y, z group1person2: x, z, d ... group2person1: z, d, l ... </code></pre> <p>等等</p> <p>我想知道哪些关键字是给定组最具特征的。我试着像OkCupid在他们的博客里做的那样:<a href="http://blog.okcupid.com/index.php/the-real-stuff-white-people-like/" rel="nofollow noreferrer">http://blog.okcupid.com/index.php/the-real-stuff-white-people-like/</a></p> <p>有人能推荐合适的算法/术语/建议吗?在</p> <p>(我将用Python来做这个)</p> <p>提前谢谢!在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>基本上,他们所做的就是计算频率项乘以逆文档频率。<a href="http://en.wikipedia.org/wiki/Tf%E2%80%93idf" rel="nofollow">tf–idf</a></p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
从Django temp访问容器的方法
5 回答
从Django temp请求ModelForm实例
6 回答
从Django temp返回JSON
6 回答
从Django timesince模板等效项中删除尾部数据
6 回答
从Django timesin删除尾随数据
5 回答
从Django UpdateView模板下载文件
4 回答
从Django url传递“start”会出现错误“start()只接受2个参数(给定1个)”
10 回答
从Django url运行的websockets错误:RuntimeError:线程“Dummy1”中没有当前事件循环
5 回答
从Django user mod获取用户全名
6 回答
从Django UserCreateForm中删除帮助文本
3 回答
从Django values()获取外键值
8 回答
从Django vi中的按钮获取click事件
2 回答
从Django vi从HttpResponse检索JSON
4 回答
从Django vi以json形式返回的数据中检索元素
3 回答
从Django vi取消或取消eventlet中的芹菜任务
3 回答
从Django vi启动多核后台进程
2 回答
从Django vi开始
9 回答
从Django Vi构建HTML
8 回答
从Django vi访问进程数据
8 回答
从Django vi调用pysnmp发送超时
4 回答