ML的Git+日志记录
mummif的Python项目详细描述
木乃伊化
安装
pip install mummify
关于
“你在git上很差劲。还有伐木。但这不是你的错。
mummify是git+为那些做机器学习的人记录。 木乃伊是简单的,固执己见的,直接建立在Git之上。 Mummify具有三个主要功能: 在机器学习脚本的顶部导入 从命令行mummify调用 每当您对模型进行更改时,请考虑:换入新算法: 重新运行 要从命令行查看木乃伊日志历史,可以运行 要回放历史(返回到以前的状态),只需从 mummify将保留交换机上的所有状态历史记录,并保持log
自动记录并提交
history
查看提交图树switch
切换到不同的提交快速启动
mummify
(在本例中为model.py
),并在脚本的最后添加mummify.log(<message>)
:import mummify
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
data = load_wine()
y = data.target
X = data.data
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=42)
model = KNeighborsClassifier()
model.fit(X_train, y_train)
accuracy = model.score(X_test, y_test)
mummify.log(f'Test accuracy: {accuracy:.3f}')
python model.py
时,将初始化一个专门的.mummify
git目录,创建一个mummify.log
文件,并跟踪模型性能:import mummify
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
data = load_wine()
y = data.target
X = data.data
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=42)
model = LogisticRegression()
model.fit(X_train, y_train)
accuracy = model.score(X_test, y_test)
mummify.log(f'Test accuracy: {accuracy:.3f}')
python model.py
mummify将更新mummify.log
文件并保存模型的状态:mummify history
:max-mbp:quick-start max$ mummify history
* HEAD mummify-f0e66a82
* mummify-75dea5e9
* mummify-start
max-mbp:quick-start max$
mummify.log
文件中获取要切换到的mummify标识符,然后从命令行运行mummify switch <id>
:mummify.log
文件不变。推荐PyPI第三方库