参与路雪

南京航空航天大学开源ALiPy:用于主动学习的Python工具包

近日,来自南京航空航天大学的研究者提出并开源了一个用于主动学习的 Python工具包 ALiPy。它不仅提供 20 余种当前最优算法的实现,还支持用户在不同主动学习环境下轻松配置和实现自己的算法。

  • 论文链接:https://arxiv.org/pdf/1901.03802.pdf

  • ALiPy 官网地址:http://parnec.nuaa.edu.cn/huangsj/alipy/index.html


简介

ALiPy 可为主动学习框架提供基于模块的实现,允许用户便捷地评估、对比和分析主动学习方法的性能。它可实现超过 20 种算法,还支持用户在不同的设置下轻松实现自己的方法。

特征

模型独立

不限制分类模型的类型。用户可以按需求在 sklearn 中使用 SVM,或者在 TensorFlow 中使用深度模型。

模块独立

用户可随意修改工具包中的一或多个模块,对其他模块不会产生影响。

无需继承即可实现自己的算法

对用户自定义函数限制极少。

支持不同设置

支持 Noisy oracles、Multi-label、Cost effective、Feature querying 等设置。

强大的工具

保存和加载中间结果、多线程、分析实验结果等。

快速启动

用户可以通过以下命令启动 ALiPy:

pip install alipy

详细安装指南,参见 http://parnec.nuaa.edu.cn/huangsj/alipy/installation.html。

  • 对于不太熟悉主动学习只是想对数据集应用该方法的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/page_adv/encapsulation_alexperiment.html,即可使用几行代码运行主动学习流程,无需了解任何背景知识。

  • 对于想要对现有主动学习方法进行实验评估的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/alipy_overview.html,了解 7 种不同设置下的 20 余种当前最优算法。

  • 对于想要实现自己的算法、执行主动学习实验的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/10_mins_to_alipy.html,学习如何使用 ALiPy 轻松实施主动学习实验。

实现策略

ALiPy 目前提供不同主动学习设置下的多种常见策略,新算法将会在后续更新中逐步添加。

如上图所示,ALiPy 提供的 20 多种算法涉及实例选择、多标签数据、特征查询等不同设置。ALiPy 官网上还展示了 ALiPy 在实例查询等设置下的运行机制。如下所示:

实例查询

Noisy Oracles

不同成本数据集

特征查询

工程Python
3
相关数据
TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

主动学习技术

主动学习是半监督机器学习的一个特例,其中学习算法能够交互式地查询用户(或其他信息源)以在新的数据点处获得期望的输出。 在统计学文献中,有时也称为最佳实验设计。

推荐文章
暂无评论
暂无评论~