机器学习中怎样将语义特征化谢邀首先申明

谢邀
首先申明，我不看好这个方向，费死劲了，结果还不如手写几个正则表达式。
现在基于神经网络的深度机器学习火了，然后到处都在应用它，似乎它就是万灵药。其实是大谬。神经网络擅长对内部关联简单、但是模糊的系统进行分析。而sql注入、xss这些安全攻击，正好是相反面 - 内部关联复杂、精确，1个字符的差别可能就是漏洞和误报的差别。
有点类似通过面部识别来寻找绿教恐怖分子。如果不在乎误报，只要是大胡子都抓，那可以保证抓到98%的恐怖分子。可是大胡子里的恐怖分子也许只有10%，从脸上是分辨不出来这10%的，所以误报很严重。
回到你的问题，如果还是想要试试看，这里可以下载长亭的WAF的白皮书：雷池 Web 防火墙 - 长亭科技。里面介绍了一些他们做不完整语法、语义分析的思想，估计对你有参考意义。

■网友
最好自己把语句解析成树再给模型吧，或者用大量无标注的数据预训练（不看好），能不难为模型就尽量不难为模型。
■网友
【机器学习中怎样将语义特征化】 谢邀。安全这个领域不太了解。抛砖引玉一下，我刚搜到两篇论文，希望对题主有帮助。一篇是A Learning-Based Approach to the Detection of SQL Attacks，2005年的文章，Google Scholar引用数340+。另一篇是A Survey on Server-side Approaches to Securing Web Applications，2014年的综述性文章，涵盖范围更广

机器学习中怎样将语义特征化

推荐阅读

馒头面发的很好蒸好却塌了,馒头怎么蒸才不会塌陷-

罗掌柜体育姚明上榜，美媒给出NBA六大令人惋惜球员！撕裂之城独占两席

何有强|柳岩穿衣风格“变”了！穿格纹大衣配牛仔裤清新又洋气，超好看

爱车者说V|全力打造高端智能品牌！，长安汽车、华为、宁德时代三家强强联合

爱情幸运星座|请你们擦亮眼睛大声说不，最容易出备胎的四个星座

众说车云|原车的防冻液可以用多少年？变少了咋办？

50岁女人一定要打扮的优雅，看这位短发妈妈，老了也是一枝花

#后竹游戏#奥术精准值得入手吗？盘点《魔兽世界》怀旧里的极品布衣护腕

孙艺珍|气质女神，26岁成影后，40岁嫁初恋，今提前生子，儿子颜值受期待

昙花怎么养才能更旺盛昙花怎么养

入冬后就馋这个馅的包子，皮薄馅大酸爽美味，一次蒸两锅都不够吃

医保|10月起，农村医保再增两个惠农新政策，普及所有农民

批复了！深圳、青岛同时宣布！

【】“一法可安香江”——国新办举行新闻发布会介绍香港国安法的有关情况并答记者问

虚拟养老院能缓解养老难吗

热身活动有哪些呢

看盘|秦洪看盘｜多头布局不当，指数冲高受阻

【珺珺说时尚】吊带蝴蝶结性感又优雅，颖儿太拼了！身穿大露背性感鱼尾裙

梁山排名最憋屈的2位好汉，实力不输五虎将，却被放在了地煞

「」肾里长石头，就要猛喝水吗？