文本可视化python包

titulus的Python项目详细描述


提图斯

文本可视化python包

fromtitulusimportcolor,print_test="Nous sommes le 12/24/2018 aujourd'hui. Mon numéro de tel est le (301)227-1340"tokens=test.split()weights=np.random.randint(low=0,high=10,size=len(tokens))print_(' '.join(color(tokens,weights,n=10)))

alt text

fromsklearn.datasetsimportfetch_20newsgroupsfromsklearn.feature_extraction.textimportTfidfVectorizerfromsklearn.linear_modelimportSGDClassifierfromsklearn.pipelineimportPipelinecategories=['alt.atheism','talk.religion.misc']newsgroups_train=fetch_20newsgroups(subset='train',categories=categories)newsgroups_test=fetch_20newsgroups(subset='test',categories=categories)X_train,X_test=newsgroups_train.data,newsgroups_test.datay_train,y_test=newsgroups_train.target,newsgroups_test.target
idx=np.random.randint(len(X_vec_list))tokens=tokenizer(X_train[idx])token_idx=[voc.index(t)iftinvocelse-1fortintokens]weights=[X_vec_arr[idx,:][i]ifi>0else0foriintoken_idx]print_(' '.join(color(tokens,weights,start_hex="#FEFEFE",finish_hex="#00a4e4",n=20)))

alt text

text_clf=Pipeline([('vect',vectorizer),('clf',SGDClassifier(loss='hinge',penalty='l2',tol=0.2,alpha=1e-3,max_iter=15,random_state=42)),])_=text_clf.fit(X_train,y_train)X_vec=vectorizer.transform(X_train)X_vec_arr=X_vec.toarray()X_vec_list=[list(x)forxinX_vec_arr]voc=vectorizer.get_feature_names()idx=np.random.randint(len(X_vec_list))tokens=tokenizer(X_train[idx])token_idx=[voc.index(t)iftinvocelse-1fortintokens]weights_=np.multiply(X_vec_arr[idx,:],text_clf.named_steps['clf'].coef_[0,:])weights=[weights_[i]ifi>0else0foriintoken_idx]print_(' '.join(color(tokens,weights,start_hex="#34BF49",finish_hex="#BE0027",middle_hex="#FEFEFE",n=20)))

alt text

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java流/下载文件,无需在Spring Boot中保留内存   kotlin/java是否有类似TryParse()的东西?   java Spring引导找不到用户类型的属性ID   java Spring 2到Spring 3的迁移:一个控制器用于多个视图   java包含多个程序包名为“安卓”的库。支持图样可提取'   java spring JPA是否支持自定义值框架?   java转义出基于文本字段的搜索栏   java AAPT:错误:未找到样式属性“安卓:attr/WindowsPlashCreenBackground”   java从文本文件中读取纬度和经度   java哪里可以找到如何使用排序的示例。顺序ignorecase(),其中nullhandling nulls last用于自定义Spring JPA如何提供查询   尝试使用Dialogflow上的Webhook动态给出响应时,java获取Webhook响应错误(206)   如何在java中替换匹配的字符串?   java模拟数学的最大价值。随机的   java Spring RestTemplate GET请求未给出正确响应   春爪哇。lang.IllegalArgumentException   java系统。load()永远不会发生   java剪辑循环不工作   java如何从maven构建中删除staxapi   java ThreadPoolExecutor的排队行为是否可以自定义,以更喜欢创建新线程而不是排队?