在Java中,過濾敏感詞可以通過多種方法實現。下面是一個簡單的示例代碼,演示了如何使用正則表達式來過濾敏感詞:
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class SensitiveWordFilter {
public static void main(String[] args) {
List<String> sensitiveWords = new ArrayList<>();
sensitiveWords.add("bad");
sensitiveWords.add("evil");
String text = "This is a bad text containing evil words.";
String filteredText = filterSensitiveWords(text, sensitiveWords);
System.out.println("Filtered Text: " + filteredText);
}
public static String filterSensitiveWords(String text, List<String> sensitiveWords) {
StringBuilder filteredText = new StringBuilder(text);
for (String word : sensitiveWords) {
String regex = "\\b" + Pattern.quote(word) + "\\b";
Pattern pattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE);
Matcher matcher = pattern.matcher(filteredText);
while (matcher.find()) {
int start = matcher.start();
int end = matcher.end();
for (int i = start; i < end; i++) {
filteredText.setCharAt(i, '*');
}
}
}
return filteredText.toString();
}
}
在上述示例中,我們定義了一個敏感詞列表`sensitiveWords`,并將要過濾的文本存儲在變量`text`中。然后,我們定義了一個`filterSensitiveWords()`方法,接受文本和敏感詞列表作為參數,并返回過濾后的文本。
在`filterSensitiveWords()`方法中,我們遍歷敏感詞列表,并為每個敏感詞創建一個正則表達式。我們使用`\b`邊界匹配符來確保只匹配完整的單詞,使用`Pattern.quote()`方法來轉義敏感詞中的特殊字符,并使用`Pattern.CASE_INSENSITIVE`標志來忽略大小寫。然后,我們使用`Matcher`對象在文本中查找敏感詞的匹配項。如果找到匹配項,我們將匹配的字符替換為`*`。
在示例中,文本中的敏感詞"bad"和"evil"將被替換為`*`。輸出結果為:"This is a *** text containing **** words."
需要注意的是,上述示例僅演示了基本的敏感詞過濾方法。實際上,敏感詞過濾可能涉及更復雜的算法和數據結構,以提高過濾效率和準確性。此外,過濾敏感詞可能也涉及到更多的規則和策略,如敏感詞的替換規則、屏蔽策略等。具體的實現方式取決于你的需求和應用場景。