重阳怡月网

Huggingface榜首开源模子惹争议:魔改Apache协议,抵达确定门槛要收钱

2024-11-02 17:25:13 来源:

开源又没残缺开源。首开

咱们知道,源模议魔议抵Huggingface 是惹争 AI 规模驰名的开源平台,任何人以及机构都可能在该平台上宣告自己以及运用他人的达确定门模子、数据集 ,槛收为业内提供了钻研利便。首开因此它深受 AI 圈的源模议魔议抵喜爱 ,其最受招待的惹争 Transformer 库已经在 GitHub 上收获 102k 的 Star 量。

不外克日,达确定门由 TII 开拓并宣告在 Huggingface 上的槛收一个大模子激发了普遍争议。该大模子是首开 400 亿参数的因果解码器模子 Falcon-40B,它在 RefinedWeb 的源模议魔议抵 1000B token 上妨碍磨炼,并运用精选数据集增强 。惹争它在 Huggingface 的达确定门 OpenLLM 排行榜上排首位 ,其功能优于 LLaMA、槛收MPT、RedPajama 以及 StableLM 等 。

排行榜地址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

尽管 Falcon-40B 模子自己很强盛,但其凭证的开源协议却在开源圈引起了轩然大波 。它在一个应承商业运用的允许证下可用 ,即如下 TII Falcon LLM License 。

开源协议:https://huggingface.co/tiiuae/falcon-40b/blob/main/LICENSE.txt

该允许证部份基于 Apache License Version 2.0。Apache License 2.0 协议来自驰名的 Apache 基金会 ,它对于商业运用友好 。运用者可能在需要的时候更正代码来知足需要并作为开源或者商业产物宣告 / 销售。

但有人发现了 TII Falcon LLM License 的一些「猫腻」 。推特用户 @natfriedman 总结了它与 Apache License 2.0 开源允许的相似与差距之处。其中相似之处在于都付与运用 、更正以及散发允许作品的普遍允许 ,要求在散发中搜罗允许文本以及归属  ,并具备责任限度、保障宽免权 。

不外差距在于,TII Falcon LLM License 要求一旦抵达支出门槛 ,需支出商业用途特许权运用费 ,而大少数开源允许不需要 。TII Falcon LLM License 对于若何宣告或者分爆发品也有格外限度, 好比要求归属于「Falcon LLM technology from the Technology Innovation Institute」。

同时,TII Falcon LLM License 不应承在其余差距的允许下重新授权作品,而大少数开源允许应承衍生作品凭证差距的协议取患上允许。TII Falcon LLM License 还清晰地清扫了 Falcon LLM 的某些版本 / 巨细的允许 ,而开源允许个别适用于所有版本 。

最后 ,TII Falcon LLM License 对于更正源代码以及目的代码都有格外的要求,除了非散发编译的模子 。总之 ,该允许应承凋谢运用以及更正 ,但同时又保存了良多自有权柄 。

@natfriedman 的意见患上到了良多人的拥护 ,另一位推特用户 @_msw_直截了当地指出 ,将专有允许基于受信托的 Apache License 2.0 之上并称其为「开源」(实际上不是真正的开源),这种运用 Apache 软件基金会来之不易的信誉以及品牌的做法是不同过错的 。

又有人问了 ,这象征着 Falcon-40B 不开源或者不是收费软件 ?@_msw_回覆称它既不开源也不是收费软件。

吃瓜公共有的拥护并以为 TII Falcon LLM License 根基不是开源允许 ,但也有的指出 TII Falcon LLM License 本便是「部份」基于开源协议。

业内处置开源人士宣告了意见 ,以为魔改 Apache 或者其余主流开源允许证不叫开源 ,致使算不上凋谢内核  。

Falcon-40B 是否开源但又不残缺开源呢 ?机械之心的读者们,你们奈何样看 ?

参考链接:https://huggingface.co/tiiuae/falcon-40b