「科技刀」Papers|韩松、朱俊彦等人提出GAN压缩法;西湖大学登Science封面,7( 二 )
文章图片
具有不同backbone的DH上的控制变量研究 。 DCN和MT分别表示可变形convnet和多尺度测试;PA表示求取epoch参数的均值 。 推荐:给定这类表现良好的实例边界框 , 研究者进一步设计了一个简单的实例级语义分割pipeline , 并在分割挑战中取得了第一名 。 论文3:Stanza:APythonNaturalLanguageProcessingToolkitforManyHumanLanguages
作者:PengQi、YuhaoZhang、ChristopherD.Manning等论文链接:https://arxiv.org/pdf/2003.07082v1.pdf摘要:在本文中 , 来自斯坦福大学的研究者将介绍Stanza , 这是一个支持66种人类语言的开源Python自然语言处理工具包 。 与现有的广泛使用的工具包相比 , Stanza具有用于语言分析的语言不可知的全神经管道 , 包括标记化、多词标记扩展、词形化、词性和词性和形态特征标记 , 依赖项解析以及命名实体识别 。 他们已经对Stanza进行了总共112个数据集的训练 , 其中包括UniversalDependencies树库和其他多语种语料库 , 结果显示相同的神经体系结构可以很好地泛化并在所有测试的语言上实现优越性能 。 此外 , Stanza包括一个与广泛使用JavaStanfordCoreNLP软件相连接的本地Python接口 , 该接口进一步扩展了其功能 , 以涵盖共引用解析和关系提取等其他任务 。
文章图片
本文Stanza神经NLPpipeline整体架构图 。
文章图片
本文Stanza与其他流行NLP工具包的特性对比 。 推荐:一经开源 , 便引起了社区的热议 。 李飞飞就在推特上点赞了这个项目 。 论文4:NaturalLanguageProcessingandTextMiningwithGraph-StructuredRepresentations
作者:BangLiu论文链接:https://sites.ualberta.ca/~bang3/files/PhD-Thesis.pdf摘要:自然语言的形式及其语意具有层次性(hierarchical) , 组合性(compositional)和灵活性(flexible) 。 已有的研究并未充分利用各类文本中存在的语义结构 。 图(graph)是一种通用且强大的表示形式 , 可以表达各种不同对象以及它们之间的联系 , 无论是在自然语言处理 , 还是在社交网络 , 现实世界等各种场景都无处不在 。 本论文在深度学习强大的表示学习能力的基础上 , 设计并结合了不同的文本的图结构化表示 , 并利用图结构计算模型 , 例如图神经网络(GraphNeuralNetworks),去解决不同的自然语言处理和文本挖掘问题 。 论文包含三大部分:第一部分介绍了文本的聚类和匹配 , 提出各类匹配问题的结构化算法 , 并进一步提出StoryForest系统用于新闻事件的聚类组织和结构化表示 。 该系统落地到腾讯QQ浏览器热点事件挖掘 。 第二部分关注文本挖掘 , 提出了AttentionOntology兴趣图谱 , 挖掘和描述用户不同粒度的兴趣点 , 建立不同兴趣点之间的联系 , 并可用于刻画文章主题 。 这部分工作显著提高了QQ浏览器 , 手机QQ , 微信等应用中的信息流推荐系统的效果 。 第三部分关注文本生成 , 提出了ACS-QG系统 , 自动从无标注文本中生成高质量的问答对 , 可用于问答系统的训练 , 有助于大大减少数据集创建成本 , 以及提高机器阅读理解的能力 。
文章图片
论文组成架构 。
文章图片
基于图结构表征的论文内容概览 。 推荐:本文是阿尔伯塔大学BangLiu的博士毕业论文 , 此君公开自己的thesis可谓自信 , 堪称大佬!论文5:CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization
作者:YifanSun、ChangmaoCheng、YichenWei等论文链接:https://arxiv.org/pdf/2002.10857.pdf摘要:深度特征学习有两种基本范式 , 分别是使用类标签和使用正负样本对标签进行学习 。 使用类标签时 , 一般需要用分类损失函数(比如softmax+crossentropy)优化样本和权重向量之间的相似度;使用样本对标签时 , 通常用度量损失函数(比如triplet损失)来优化样本之间的相似度 。 这两种学习方法之间并无本质区别 , 其目标都是最大化类内相似度(s_p)和最小化类间相似度(s_n) 。 在这篇论文中 , 来自旷视研究院、北航、澳大利亚国立大学和清华大学的研究者提出用于深度特征学习的CircleLoss , 从相似性对优化角度正式统一了两种基本学习范式(分类学习和样本对学习)下的损失函数 。 通过进一步泛化 , CircleLoss获得了更灵活的优化途径及更明确的收敛目标 , 从而提高所学特征的鉴别能力;它使用同一个公式 , 在两种基本学习范式 , 三项特征学习任务(人脸识别 , 行人再识别 , 细粒度图像检索) , 十个数据集上取得了极具竞争力的表现 。
推荐阅读
- 「定焦爱科技」3拯救低电量焦虑症,超大电池搭配超快闪充,续航出色的iQOO
- #科技小李#小屏爱好者嗨起来,4.7寸新iPhone确认四月发布,价格是大亮点!,原创
- 中国网科技@撤出液晶面板生产,三星将关闭两座工厂
- #即科技#107国赞同票作废!,想“加入”联合国?中国使用一票否决
- 【腾讯科技】全球应用市场第一季度大爆发:花费达234亿美元创纪录 时长增20%
- 即科技■决定权掌握在中国手,?联合国五常将变六常?此国获美俄一致力挺
- [笔记本电脑]乙辰科技正式发布首款WiFi6新品:北斗II号分布式无线路由器
- 『极速聊科技』目前仅剩10余人,暴风集团:员工持续大量流失
- 【科技生活快报】普京:已与欧佩克和美国就石油价格下跌问题进行讨论
- 「科技小数据」消费信贷的客户呈现出年轻化的趋势,新消费崛起