面试遇难题,问:游戏中的敏感词过滤是如何实现的,该怎么回答?
你好,你应该像我一样是个程序员。涉及java和web。有一个replace()方法,后跟两个参数,用于“setandreplace”和用“*”替换一些“敏感词”。具体技术可以关注我,我带你去学技术!@很难找到新的高质量数据。关注它们并重新发布它们是不好的
首先,为敏感词建立一个同义词库。它可以是xml或db存储。其次,对页面信息进行抓取,并用敏感词进行过滤。(如果你想人性化,你需要一个语义库来进行分词检索)同样,你可以在抓取页面时得到页面的最后修改时间和大小,并保存在db中。最后,再次爬网时,比较“上次修改”和“页面内容”以确定页面是否已被修改。(页面大小和修改时间可以通过获取页面头文件信息获得)1000万和1亿之间没有差别。通过服务器组件压力计算,测试单个服务器的软硬件性能,合理配置软硬件。
原文标题:敏感词过滤 面试遇难题,问:游戏中的敏感词过滤是如何实现的,该怎么回答?,如若转载,请注明出处:https://www.saibowen.com/news/17514.html
免责声明:此资讯系转载自合作媒体或互联网其它网站,「赛伯温」登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考。