代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Asp.Net
】
改进的脏字过滤算法
作者:
Dezai.CN
/ 发布于
2011/9/13
/
885
<div>/**//// <summary> /// 读取脏字字典 /// </summary> /// <returns></returns> private string ReadDic() { string FileName = HttpContext.Current.Server.MapPath("~/App_Data/test.txt"); if (!File.Exists(FileName)) { return ""; } else { StreamReader sr = new StreamReader(FileName, Encoding.Default); string words = sr.ReadToEnd(); sr.Close(); return words; } } private string[] ReadFromText() { string FileName = HttpContext.Current.Server.MapPath("~/App_Data/test01.txt"); ArrayList list=new ArrayList(); if (File.Exists(FileName)) { StreamReader sr = new StreamReader(FileName, Encoding.Default); string s = ""; int i = 0; while ((s = sr.ReadLine()) != null) { if (i == 10000) { break; } list.Add(s); i++; } } return (string[])list.ToArray(typeof(string)); } /**//// <summary> ///newFilter 的摘要说明 /// </summary> public class newFilter { public newFilter() { } private HashSet<string> hash = new HashSet<string>(); private byte[] fastCheck = new byte[char.MaxValue]; private BitArray charCheck = new BitArray(char.MaxValue); private int maxWordLength = 0; private int minWordLength = int.MaxValue; /**//// <summary> /// 快速查找 /// </summary> /// <param name="badWords"></param> /// <param name="tarStr"></param> /// <returns></returns> public bool FastDetect(string[] badWords, string tarStr) { bool result; Prepare(badWords); result = GoDetect(tarStr); return result; } /**//// <summary> /// 快速查找初始化 /// </summary> /// <param name="badWords"></param> private void Prepare(string[] badWords) { foreach (string word in badWords) { maxWordLength = Math.Max(maxWordLength, word.Length); minWordLength = Math.Min(minWordLength, word.Length); for (int i = 0; i < 7 && i < word.Length; i++) { fastCheck[word[i]] |= (byte)(1 << i); } for (int i = 7; i < word.Length; i++) { fastCheck[word[i]] |= 0x80; } if (word.Length == 1) { charCheck[word[0]] = true; } else { hash.Add(word); } } } /**//// <summary> /// 快速查找主函数 /// </summary> /// <param name="text"></param> /// <returns></returns> private bool GoDetect(string text) { int index = 0; while (index < text.Length) { if ((fastCheck[text[index]] & 1) == 0) { while (index < text.Length - 1 && (fastCheck[text[++index]] & 1) == 0) ; } for (int j = 1; j <= Math.Min(maxWordLength, text.Length - index - 1); j++) { if ((fastCheck[text[index + j]] & (1 << Math.Min(j, 7))) == 0) { break; } else { if (j == 1) { if (charCheck[text[index]]) { return true; } } string sub = text.Substring(index, j + 1); if (hash.Contains(sub)) { return true; } } } index++; } return false; } /**//// <summary> /// 快速替换 /// </summary> /// <param name="badWords"></param> /// <param name="tarStr"></param> /// <returns></returns> public string[] FastReplace(string[] badWords, string tarStr) { Prepare(badWords); string[] result = GoReplace(tarStr); return result; } /**//// <summary> /// 快速替换主函数 /// </summary> /// <param name="text"></param> /// <returns></returns> private string[] GoReplace(string text) { ArrayList list = new ArrayList(); int index = 0; while (index < text.Length) { if ((fastCheck[text[index]] & 1) == 0)//如果这个字符不是脏字的首字符 { while (index < text.Length - 1 && (fastCheck[text[++index]] & 1) == 0) ;//则检测下一个字符 } for (int j = 1; j <= Math.Min(maxWordLength, text.Length - index - 1); j++) { if ((fastCheck[text[index + j]] & (1 << Math.Min(j, 7))) == 0)//如果这个字符不是脏字中某个字符所在的位置,则break { break; } else { if (j == 1) { if (charCheck[text[index]]) { //text = text.Replace(text[index], '*'); if (!list.Contains(text[index].ToString())) { list.Add(text[index].ToString()); } } } string sub = text.Substring(index, j + 1); int flag = j + 1; if (hash.Contains(sub)) { for (int k = 1; k <= Math.Min(maxWordLength - sub.Length - 1 , text.Length - index - flag); k++) { string newSub = text.Substring(index, j + 1 + k); if (hash.Contains(newSub)) { flag = j + 1 + k; } } if (flag > j + 1)//表示有更大的匹配 { sub = text.Substring(index, flag); } //text = text.Replace(sub, "***"); if (!list.Contains(sub)) { list.Add(sub); } } } } index++; } //return text; return (string[])list.ToArray(typeof(string)); } } </div>
试试其它关键字
脏字过滤算法
同语言下
.
gzip压缩
.
实现http多线程断点续传下载文件
.
实现多线程断点续传下载大文件
.
生成字符串的 CheckSum
.
根据 UserAgent 获取浏览器的类型和版本
.
根据 Agent 判断是否是智能手机
.
隐藏手机号中间四位为*方法
.
合并图片(二维码和其他图片合并)
.
ASP.NET CORE中判断是否移动端打开网页
.
ASP.NET(C#)实现页面计时(定时)自动跳转
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
Dezai.CN
贡献的其它代码
(
4037
)
.
多线程Socket服务器模块
.
生成随机密码
.
清除浮动样式
.
弹出窗口居中
.
抓取url的函数
.
使用base HTTP验证
.
div模拟iframe嵌入效果
.
通过header转向的方法
.
Session操作类
.
执行sqlite输入插入操作后获得自动编号的ID
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3