从样式化的docx文件中读取遗传序列
crazydoc的Python项目详细描述
CrazyDoc是一个Python库,用于解析最常见的DNA表示格式之一:色彩鲜艳、注释时尚的MS Word文档。
尽管fasta或genbank等其他标准得到了现代序列编辑器的更好支持,但没有一种标准在分子生物学家中享有与word女士的.docx格式相同的受欢迎程度,这种格式仅受用户的复杂性和创造性的限制。
信息
pip安装:
pip install crazydoc
github页
https://github.com/Edinburgh-Genome-Foundry/crazydoc
许可证:麻省理工学院,爱丁堡基因组铸造厂版权所有