<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.3" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>
<channel>
	<title>《寻找相似文章》的评论</title>
	<link>http://yskin.net/2006/07/similar-post.html</link>
	<description>计算机技术，生活</description>
	<pubDate>Sat, 22 Nov 2008 10:14:35 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.3</generator>
		<item>
		<title>yskin</title>
		<link>http://yskin.net/2006/07/similar-post.html#comment-12128</link>
		<dc:creator>yskin</dc:creator>
		<pubDate>Tue, 26 Feb 2008 14:39:51 +0000</pubDate>
		<guid>http://yskin.net/2006/07/similar-post.html#comment-12128</guid>
		<description>不好意思，我的文章里好像只提到了Levenshtein，而没有提到Wagner and Fischer。

不过，我稍微在网上查了一下，Wagner and Fischer好像是指在1974年Wagner和Fischer两位学者写的一篇Paper: &lt;a href="http://portal.acm.org/citation.cfm?coll=GUIDE&#038;dl=GUIDE&#038;id=321811" rel="nofollow"&gt;The String-to-String Correction Problem&lt;/a&gt;。

另外，在中文世界里，我找到一篇台湾国立中山大学资讯工程学系硕士论文&lt;a href=http://etd.lib.nsysu.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0912105-124156&#038;filename=etd-0912105-124156.pdf rel="nofollow"&gt;《最长共同子序列与相关问题之回顾(A Survey of the Longest Common Subsequence Problem and Its Related Problems)》&lt;/a&gt;，里面是用英文写的，在第4.1小节"The Edit Distance Problem"里提到了一句话: "The Levenshtein edit distance problem was first proposed by Levenshtein in 1965 [78,79]. A few years later, Wagner and Fischer presented some definitions and properties in their paper [129]." 意思是：“Levenshtein edit distance问题是由Levenshtein在1965年提出的。在几年之后，Wagner和Fischer在他们的论文中对Levenshtein edit distance问题提供了具体的实现方法和说明。”

也就是说，Levenshtein提出了这种比较方法，而Wagner和Fischer提供了具体实现这种方法的说明。如果你想对字符串比较进行深入的研究，建议看看上面提到的那篇硕士论文。 </description>
		<content:encoded><![CDATA[<p>不好意思，我的文章里好像只提到了Levenshtein，而没有提到Wagner and Fischer。</p>
<p>不过，我稍微在网上查了一下，Wagner and Fischer好像是指在1974年Wagner和Fischer两位学者写的一篇Paper: <a href="http://portal.acm.org/citation.cfm?coll=GUIDE&#038;dl=GUIDE&#038;id=321811" rel="nofollow">The String-to-String Correction Problem</a>。</p>
<p>另外，在中文世界里，我找到一篇台湾国立中山大学资讯工程学系硕士论文<a href=http://etd.lib.nsysu.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0912105-124156&#038;filename=etd-0912105-124156.pdf rel="nofollow">《最长共同子序列与相关问题之回顾(A Survey of the Longest Common Subsequence Problem and Its Related Problems)》</a>，里面是用英文写的，在第4.1小节&quot;The Edit Distance Problem&quot;里提到了一句话: &quot;The Levenshtein edit distance problem was first proposed by Levenshtein in 1965 [78,79]. A few years later, Wagner and Fischer presented some definitions and properties in their paper [129].&quot; 意思是：“Levenshtein edit distance问题是由Levenshtein在1965年提出的。在几年之后，Wagner和Fischer在他们的论文中对Levenshtein edit distance问题提供了具体的实现方法和说明。”</p>
<p>也就是说，Levenshtein提出了这种比较方法，而Wagner和Fischer提供了具体实现这种方法的说明。如果你想对字符串比较进行深入的研究，建议看看上面提到的那篇硕士论文。</p>
]]></content:encoded>
	</item>
	<item>
		<title>helene</title>
		<link>http://yskin.net/2006/07/similar-post.html#comment-12124</link>
		<dc:creator>helene</dc:creator>
		<pubDate>Tue, 26 Feb 2008 10:23:49 +0000</pubDate>
		<guid>http://yskin.net/2006/07/similar-post.html#comment-12124</guid>
		<description>Levenshtein是计算两个词之间的相似性，那Wagner and Fischer也是计算两个词之间的距离，那他和Levenshtein有什么区别？</description>
		<content:encoded><![CDATA[<p>Levenshtein是计算两个词之间的相似性，那Wagner and Fischer也是计算两个词之间的距离，那他和Levenshtein有什么区别？</p>
]]></content:encoded>
	</item>
	<item>
		<title>lonor</title>
		<link>http://yskin.net/2006/07/similar-post.html#comment-8468</link>
		<dc:creator>lonor</dc:creator>
		<pubDate>Mon, 26 Mar 2007 06:08:42 +0000</pubDate>
		<guid>http://yskin.net/2006/07/similar-post.html#comment-8468</guid>
		<description>dancefire想法好: 中文-&#62;拼音-&#62;soundex处理. 我觉得应该可行,而且中文-&#62;拼音也有较快的处理算法.</description>
		<content:encoded><![CDATA[<p>dancefire想法好: 中文-&gt;拼音-&gt;soundex处理. 我觉得应该可行,而且中文-&gt;拼音也有较快的处理算法.</p>
]]></content:encoded>
	</item>
	<item>
		<title>dancefire</title>
		<link>http://yskin.net/2006/07/similar-post.html#comment-4212</link>
		<dc:creator>dancefire</dc:creator>
		<pubDate>Tue, 28 Nov 2006 08:05:01 +0000</pubDate>
		<guid>http://yskin.net/2006/07/similar-post.html#comment-4212</guid>
		<description>为什么Levenshtein不合适中文？如果是unicode编码的话，应该所有文字都适用的。能说说原因么？

soundex和metaphone是为英文准备的，但是中文有汉语拼音，我们可以对汉语拼音进行简单的变形，也可以达到soundex或者metaphone同样的效果。</description>
		<content:encoded><![CDATA[<p>为什么Levenshtein不合适中文？如果是unicode编码的话，应该所有文字都适用的。能说说原因么？</p>
<p>soundex和metaphone是为英文准备的，但是中文有汉语拼音，我们可以对汉语拼音进行简单的变形，也可以达到soundex或者metaphone同样的效果。</p>
]]></content:encoded>
	</item>
</channel>
</rss>
