中文分词搜索,asp拆词搜索,asp智能分词搜索,asp分词技术

yoken 阅读:1801 2010-04-27 15:00:00 评论:0

在做一个网站时,老板让实现像百度那样的搜索功能,以前asp实现的都是模糊搜索,匹配查询。没办法。到网上搜搜看,我发现网上提供的方法有这几种,一是建个词库,二是用分词组件,三就是我说的这种,自动分词技术,不过也不是智能的分词,只是隔两个词匹配。最好的是建个词库,根据用户的输入来扩充词库,但对于中小型网站,这可能不太需要。
由于本人并不熟悉PHP,对ASP.NET也不熟练,所以只能研究ASP了,下面的东东是网上找到的,能实现类似搜索引擎分词功能,虽然功能不是很完善,但精髓已经给出来,我得好好研究。用ASP实现搜索引擎的功能是一件很方便的事,可是,如何实现类似3721的智能搜索呢?比如,当在搜索条件框内输入“中国人民”时,自动从中提取“中国”、“人民”等关键字并在数据库内进行搜索。
    第一步,我们要建立一个名为db_sample.mdb的数据库(本文以Access2000数据库为例),并在其中建立表T_Sample。表T_Sample包括如下字段:
   ID 自动编号
   U_Name 文本
   U_Info 备注
    第二步,我们开始设计搜索页面Search.asp。该页面包括一个表单(Frm_Search),表单内包括一个文本框和一个提交按钮。并将表单的method属性设为“get” ,action属性设为“Search.asp",即提交给网页自身。代码如下:

    以下是代码片段:
<!-- Search.asp --> 
<form name="frm_Search" method="get" action="Search.asp"> 
请输入关键字: 
<input type="text" name="key" size="10"> 
<input type="submit" value="搜索"> 
</form>
    下面,就进入了实现智能搜索的关键部分。
    首先,建立数据库连接。在Search.asp的开始处加入如下代码:

    以下是代码片段:
<% 
  Dim strProvider,CNN 
  strProvider="Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" 
  strProvider=strProvider & Server.MapPath("\") & "\data\db_Sample.mdb" '假设数据库存放在主页根目录下的data目录下 
  Set CNN = Server.CreateObject("ADODB.connection") 
  CNN.Open strProvider 打开数据库连接 
%>

    接下来,判断 ASP页所接收到的数据,并在数据库中进行搜索。
    以下是代码片段:
<font color="#FF0000">未找到任何结果!!!</font> 
<% 
Else 
%> 
    搜索名称为“<font color="#FF0000"><%= S_Key %></font>”的项,共找到 <font color="#FF0000"><%= RST.RecordCount %></font> 项:<p> 
<% 
While Not RST.EOF 遍历整个记录集,显示搜索到的信息并设置链接 
%> 
<!-- 此处可设为你所需要的链接目标 --> 
<font style="font: 12pt 宋体"><a href="info.asp?ID=<%= RST("ID") %>" target="_blank"><%= RST("U_Name") %></a></font> 
<!-- 显示部分详细内容 --> 
<font style="font: 9pt 宋体"><%= Left(RST("U_Info"),150) %></font><p> 
<% 
  RST.MoveNext 
  Wend 
   RST.Close 
   Set RST=Nothing 
  End If 
End If 
%>
    在上面的代码中,有一个自定义函数 AutoKey ,该函数是实现智能搜索的核心所在。代码如下:

    以下是代码片段:
<%  
Function AutoKey(strKey)
'361du.net
CONST lngSubKey=2  
Dim lngLenKey, strNew1, strNew2, i, strSubKey  
'检测字符串的合法性,若不合法则转到出错页。出错页你可以根据需要进行设定。  
if InStr(strKey,"=")<>0 or InStr(strKey,"`")<>0 or InStr(strKey,chr(34))<>0 or InStr(strKey,"\")<>0 or InStr(strKey,",")<>0 or InStr(strKey,"<")<>0 or InStr(strKey,">")<>0 then
Response.Redirect "error.htm"  
End If  
lngLenKey=Len(strKey)
Select Case lngLenKey  
Case 0 '若为空串,转到出错页  
Response.Redirect "error.htm"  
Case 1 '若长度为1,则不设任何值  
strNew1=""  
strNew2=""  
Case Else '若长度大于1,则从字符串首字符开始,循环取长度为2的子字符串作为查询条件  
For i=1 To lngLenKey-(lngSubKey-1)  
strSubKey=Mid(strKey,i,lngSubKey)  
strNew1=strNew1 & " or oflink_keyword like '%" & strSubKey & "%'"  
Next  
End Select  
'得到完整的SQL语句
AutoKey=strNew1 
End Function 
 
response.write AutoKey("最大的商品搜索引擎")
%>
    要实现智能搜索,其核心就是将搜索关键字进行自动分组。在此处,我们使用了循环取长度为2的子串的方法。为什么不将子串长度定为1、3、4或其他呢?这是因为若子串长度小于2即为1时,会失去将关键字分组的功能,而若子串长度大于2,则会丢失一些词组。大家可以将 CONST lngSubKey=2改为其他数字试一试,孰优孰劣自见分晓。
    最后,别忘了将数据连接关闭,以释放资源。

    以下是代码片段:
<% 
CNN.Close 
Set CNN=Nothing 
%>
    至此,这个智能搜索引擎已经完成了。你还可以将其继续完善,比如添加分页、突出显示等功能。

转载保留链接!网址:https://80920140.com/post/1051.html

标签:快的
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源; 2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任; 3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容