-
java 查找子串算法_Java 中字符串的子串搜索
2021-02-28 09:30:56基友前两天参加了阿里的实习生面试,问了个问题,就是关于字符串的子串搜索的问题。想想实现方式无非就是两层循环,但是 java 中是有现成实现的,于是我就去查查源码,看看 java 语言怎么实现这个的,发现也就是...基友前两天参加了阿里的实习生面试,问了个问题,就是关于字符串的子串搜索的问题。想想实现方式无非就是两层循环,但是 java 中是有现成实现的,于是我就去查查源码,看看 java 语言怎么实现这个的,发现也就是差不多的意思。
java.lang 包中 String 类 有几个 indexOf() 函数,我要寻找的是 indexOf(String str) 这个的具体实现,发现了
public int indexOf(String str) {
return indexOf(str, 0);
}
然后 F3 继续找,public int indexOf(String str, int fromIndex) {
return indexOf(value, offset, count, str.value, str.offset, str.count,
fromIndex);
}这个调用应该就是算法的实现了,继续 F3
/**
* Code shared by String and StringBuffer to do searches. The source is the
* character array being searched, and the target is the string being
* searched for.
*
* @param source
* the characters being searched.
* @param sourceOffset
* offset of the source string.
* @param sourceCount
* count of the source string.
* @param target
* the characters being searched for.
* @param targetOffset
* offset of the target string.
* @param targetCount
* count of the target string.
* @param fromIndex
* the index to begin searching from.
*/
static int indexOf(char[] source, int sourceOffset, int sourceCount,
char[] target, int targetOffset, int targetCount, int fromIndex) {
if (fromIndex >= sourceCount) {
return (targetCount == 0 ? sourceCount : -1);
}
if (fromIndex < 0) {
fromIndex = 0;
}
if (targetCount == 0) {
return fromIndex;
}
char first = target[targetOffset];
int max = sourceOffset + (sourceCount - targetCount);
for (int i = sourceOffset + fromIndex; i <= max; i++) {
/* Look for first character. */
if (source[i] != first) {
while (++i <= max && source[i] != first)
;
}
/* Found first character, now look at the rest of v2 */
if (i <= max) {
int j = i + 1;
int end = j + targetCount - 1;
for (int k = targetOffset + 1; j < end
&& source[j] == target[k]; j++, k++)
;
if (j == end) {
/* Found whole string. */
return i - sourceOffset;
}
}
}
return -1;
}
注意这个函数是静态函数,是String and StringBuffer公用的一个工具方法,具体算法原理代码中很显而易见。
又查阅了一些资料,目前子串搜索的方法有下面几种,
KMP算法, BM算法,Sunday算法
其中无论是简单程度还是效率排序均为下面:
Sunday > BM > KMP
Sunday 算法的核心思想如下(转自百度百科):
字符串模式匹配中超越BF、KMP和BM的算法
sunday算法的概念如下:
Sunday算法是Daniel M.Sunday于1990年提出的一种比BM算法搜索速度更快的算法。其核心思想是:在匹配过程中,模式串并不被要求一定要按从左向右进行比较还是从右向左进行比较,它在发现不匹配时,算法能跳过尽可能多的字符以进行下一步的匹配,从而提高了匹配效率。
假设在发生不匹配时S[i]≠T[j],1≤i≤N,1≤j≤M。此时已经匹配的部分为u,并假设字符串u的长度为L。如图1。明显的,S[L+i+1]肯定要参加下一轮的匹配,并且T[M]至少要移动到这个位置(即模式串T至少向右移动一个字符的位置)。
图1 Sunday算法不匹配的情况
分如下两种情况:
(1) S[L+i+1]在模式串T中没有出现。这个时候模式串T[0]移动到S[T+i+1]之后的字符的位置。如图2。
图2 Sunday算法移动的第1种情况
(2)S[L+i+1]在模式串中出现。这里S[L+i+1]从模式串T的右侧,即按T[M-1]、T[M-2]、…T[0]的次序查找。如果发现S[L+i+1]和T中的某个字符相同,则记下这个位置,记为k,1≤k≤M,且T[k]=S[L+i+1]。此时,应该把模式串T向右移动M-k个字符的位置,即移动到T[k]和S[L+i+1]对齐的位置。如图3。
图3 Sunday算法移动的第2种情况
依次类推,如果完全匹配了,则匹配成功;否则,再进行下一轮的移动,直到主串S的最右端结束。该算法最坏情况下的时间复杂度为O(N*M)。对于短模式串的匹配问题,该算法执行速度较快。
Sunday算法思想跟BM算法很相似,在匹配失败时关注的是文本串中参加匹配的最末位字符的下一位字符。如果该字符没有在匹配串中出现则直接跳过,即移动步长= 匹配串长度+1;否则,同BM算法一样其移动步长=匹配串中最右端的该字符到末尾的距离+1。
现举个例子来说明:
比如:
匹配串:abcbczdxzc
模式串:zbcac
这里我们看到b-a没有对上,我们就看匹配串中的z在模式串的位置,然后对齐。
匹配串:abcbczdxzc
模式串: zbcac
如果模式串中的没有那个字符的话就跳过去。
匹配串:abcbcedxzcs
模式串:zbcac
e不在模式串中出现,那么我们就
匹配串:abcbcedxzcs
模式串: zbcac
附一个Sunday算法的 C++ 实现(原文链接:http://hi.baidu.com/azuryy/item/8a50f54a2f8c72e51381dad3)
/* Sunday.h */
class Sunday
{
public:
Sunday();
~Sunday();
public:
int find(const char* pattern, const char* text);
private:
void preCompute(const char* pattern);
private:
//Let's assume all characters are all ASCII
static const int ASSIZE = 128;
int _td[ASSIZE] ;
int _patLength;
int _textLength;
};
源文件
/* Sunday.cpp */
Sunday::Sunday()
{
}
Sunday::~Sunday()
{
}
void Sunday::preCompute(const char* pattern)
{
for(int i = 0; i < ASSIZE; i++ )
_td[i] = _patLength + 1;
const char* p;
for ( p = pattern; *p; p++)
_td[*p] = _patLength - (p - pattern);
}
int Sunday::find(const char* pattern, const char* text)
{
_patLength = strlen( pattern );
_textLength = strlen( text );
if ( _patLength <= 0 || _textLength <= 0)
return -1;
preCompute( pattern );
const char *t, *p, *tx = text;
while (tx + _patLength <= text + _textLength)
{
for (p = pattern, t = tx; *p; ++p, ++t)
{
if (*p != *t)
break;
}
if (*p == 0)
return tx-text;
tx += _td[tx[_patLength]];
}
return -1;
}
简单测试下:
int main()
{
char* text = "blog.csdn,blog.net";
char* pattern = "csdn,blog" ;
Sunday sunday;
printf("The First Occurence at: %d\n",sunday.find(pattern,text));
return 1;
}
注,上述算法中数组_td[],是用于记录 pattern 中每个字符的位置
-
java 字符串 子串_java字符串面试题,从一个字符串中查找子串
2021-03-22 14:12:36一个常规的字符串查找算法,两层循环,每次会记录之前匹配到的字串,完整匹配后程序会退出,如果要优化的话,需要使用KMP算法,大家可以百度,比较复杂。@RunWith(SpringRunner.class)@SpringBootTest@Slf4jpublic ...一个常规的字符串查找算法,两层循环,每次会记录之前匹配到的字串,完整匹配后程序会退出,如果要优化的话,需要使用KMP算法,大家可以百度,比较复杂。
@RunWith(SpringRunner.class)
@SpringBootTest
@Slf4j
public class findSubStringNormalTest {
@Test
public void run() {
String text = "xxb abbbb ccc add adddxdd";
String pat = "addd";
int matchlen = 0;
for (int i = 0; i < text.length(); i++) {
//外层循环控制目标文本偏移量
for (int j = 0; j < pat.length(); j++) {
//开始匹配
if (pat.charAt(j) == text.charAt(i + j)) {
matchlen++;
if (matchlen == pat.length()) {
log.info("final match :" + text.substring(i, i + j + 1));
break;
}
} else {
//记录每次匹配到的子串
if (matchlen > 0) {
log.info("match:" + text.substring(i, i + j + 1));
}
matchlen = 0;
break;
}
}
}
}
}
程序输出
com.example.findSubStringNormalTest : match:ab
com.example.findSubStringNormalTest : match:add
com.example.findSubStringNormalTest : final match :addd
-
java 字符串所有子串_java – 查找添加到给定字符串的所有子串的组合
2021-02-27 17:53:50这是一种方法: static List> substrings(String input) { // Base case: There's only one way to split up a single ... } 输出: [java] [j, ava] [ja, va] [j, a, va] [jav, a] [j, av, a] [ja, v, a] [j, a, v, a]这是一种方法:
static List> substrings(String input) {
// Base case: There's only one way to split up a single character
// string, and that is ["x"] where x is the character.
if (input.length() == 1)
return Collections.singletonList(Collections.singletonList(input));
// To hold the result
List> result = new ArrayList<>();
// Recurse (since you tagged the question with recursion ;)
for (List subresult : substrings(input.substring(1))) {
// Case: Don't split
List l2 = new ArrayList<>(subresult);
l2.set(0, input.charAt(0) + l2.get(0));
result.add(l2);
// Case: Split
List l = new ArrayList<>(subresult);
l.add(0, input.substring(0, 1));
result.add(l);
}
return result;
}
输出:
[java]
[j, ava]
[ja, va]
[j, a, va]
[jav, a]
[j, av, a]
[ja, v, a]
[j, a, v, a]
-
Java 字符串 提取子串,记录子串出现的次数
2020-12-15 17:01:03字符串问题中,常出现的查找字符串在一指定字符串中出现的次数,可以用contains()函数解答。其代码如下: int num = 0; while (res.contains(s)) { res = res.substring(res.indexOf(s) + s.length()); num++;...字符串问题中,常出现的查找字符串在一指定字符串中出现的次数,可以用contains()函数解答。其代码如下:
int num = 0; while (res.contains(s)) { res = res.substring(res.indexOf(s) + s.length()); num++; }
num为次数,res为指定字符串,s为要查找的字串。
其中,用到了substring()函数,
substring()有两种情况:
s.substring(a),提取字符串s在第a个字符处开始向后的子串;
s.substring(a, b),提取字符串s在第a个字符和第b个字符之间的子串。
所以substring()函数可以用来快速的提取某一字符串的子串。
substring()函数的效果如下:String s1 = s.substring(2); String s2 = s.substring(2, 5); System.out.println("s = " + s); System.out.println("s1 = " + s1); System.out.println("s2 = " + s2);
其执行结果为:
此处要注意字符位置是从0开始计算的。 -
java indexof 子字符串_java查询字符串的子串的用法:indexOf()
2021-02-27 21:23:40Java查找字符串中的子串共有四种方法,如下:1、int indexOf(String str) :从在向右查找,返回指定子字符串在此字符串中第一次出现的索引位置。(索引从0开始)2、int indexOf(String str, int startIndex):从指定的... -
java 字符串 子串_Java中字符串中子串的查找共有四种方法
2021-03-05 20:57:451.int indexOf(String str):返回第一次出现的指定字符串在此字符中的索引。2.int indexOf(String str,int startIndex):从指定的索引处开始,返回第一次出现的指定子字符串在此字符中的索引。3.int lastIndexOf... -
JAVA 字符串三个常用操作(查找子串、截取字符串、分割字符串)
2019-05-16 17:42:001.通过indexOf()方法来对查找子串 indexOf()语法: public int indexOf(int ch ) :返回指定字符在字符串中第一次出现处的索引,如果此字符串中没有这样的字符,则返回 -1。 或 public int indexOf(int ch, int ... -
java查询字符串的子串的用法:indexOf()
2017-07-18 14:40:00Java查找字符串中的子串共有四种方法,如下:1、int indexOf(String str) :从在向右查找,返回指定子字符串在此字符串中第一次出现的索引位置。(索引从0开始)2、int indexOf(String str, int startIndex):从指定... -
字符串找子串java算法_java – 用于在字符串中搜索子字符串的快速算法
2021-03-13 08:57:22我想做的是:给定一个输入字符串 – INSTR:“BCDEFGH”和一组候选字符串 – CAND:“AB”, “CDE”, “FG”, “H”, “IJ”查找与INSTR中的子串匹配的任何CAND字符串在这个例子中,我会匹配“CDE”,“FG”和“H”... -
java 字符串查找_Java字符串地查找操作
2021-02-12 09:23:44在一个字符串中查找字符或子串是...int indexOf(String s)该方法用于在字符串中查找与s字符串匹配的子串,若发现匹配的子串,则返回子串的起始位置索引,如果没有找到与s匹配的子串,返回-1。调用语法如下:str.inde... -
java字符串最长公共子串_两个字符串的最长公共子串)(Java)
2021-03-11 10:21:26import java.util.Collections;import java.util.HashMap;...public class H25b{/*** @查找两个字符串a,b中的最长公共子串*/public static String getLCS(String a,String b){if (a.contains(b))return b;if ... -
java 字符串首字母大写 查找子串所在的位置
2018-10-23 19:39:51对于输入字符串s(假设...3. 输出该字符串中子串str的所有位置(无需考虑子串叠加现象) 4. 将字符串中每个单词的第一个字母变成大写并输出 import java.lang.*; import java.util.*; public class Main{ publ... -
java中String类简单的字符串提取,转换,分解字符串数组,检索,获取字符串的子串,查找,字符串连接,去除...
2020-04-15 10:49:30下面展示一些 内联代码片。 package hanjia; //String类: public class hanjia{ public static void main(String args[]) { String s1=new String(... //获取一个字符串指定位置的字符:char charAt(int ... -
字符串匹配,查找子串Java
2021-02-23 11:54:54计算字符串中子串出现的次数 -
Java实现:查找子串在字符串中出现的次数
2012-03-31 10:22:16* @param source 查找的源字符串 * @param target 目标子串 * @return number of target string in source */ public static int stringFind(String source, String target){ int number = 0; int i = ... -
java最长公共子串_查找字符串最长公共子串
2021-03-01 08:37:09/***请编码实现一个命令行工具,找出指定的2个字符串的最长公共子串。*CreatebyDbLon2020/1/9*/publicclassMain{publicstaticvoidmain(String[]args){Scannerin=newScanner(System.in);in.useDelimiter("\n")... -
java string查找子串_java – 查找给定字符串的每个可能的子集
2021-03-09 00:50:20Memory efficient power set algorithm5个我试图在Java中找到每个可能的字符串字符串 – 我的意思是,如果我有一个4个字符长的单词,我想要从它派生的所有可能的3个字符长单词,所有2个字符长,所有1性格长.我最直接的... -
判断一个字符串中是否只含有相同的子字符串(子串长度>=2)
2018-10-16 21:22:54*功能描述:判断一个字符串中是否只含有相同的子字符串(子串长度>=2) 输入:abab 返回:true 输入:abcd 返回:false 循环查找的办法:从首字符处截取长度为2的字符串,在以后的字符串里看,是否包含。... -
java中字符串中的子串_Java中字符串中子串的查找共有四种方法(indexof())
2021-03-13 12:51:10Java中字符串中子串的查找共有四种方法(indexof())Java中字符串中子串的查找共有四种方法,如下:1、int indexOf(String str) :返回第一次出现的指定子字符串在此字符串中的索引。2、int indexOf(String str, int ... -
java 最长公共子串_查找字符串最长公共子串
2021-03-06 06:18:06importjava.util.LinkedList;importjava.util.List;importjava.util.Scanner;importjava.util.HashMap;importjava.util.Iterator;publicclassMain{publicstaticvoidmain(String[]args){ScannerinPut=... -
java查找循环字符子串_算法设计 - 寻找一个字符串的重复子串LRS
2021-03-05 13:17:47问题描述:首先这是一个单字符串问题。子字符串 R 在字符串 L 中至少出现两次,则称 R 是 L 的重复子串。比如字符串abcdeabcd的LRS的长度是2,LRS是abcdLongest Repeated Substring in GEEKSFORGEEKS is: ... -
Java字符串查找和截取实验报告,java 字符串截取的实例详解
2021-03-23 16:19:32java 字符串截取的实例详解题目在java中,字符串“abcd”与字符串“ab你好”的长度是一样,都是四个字符。但对应的字节数不同,一个汉字占两个字节。定义一个方法,按照指定的字节数来取子串。如:对于“ab你好”,... -
java 母串中找子串_java查找字符串中的包含子字符串的个数实现代码
2021-03-08 07:24:04} 以上这篇java查找字符串中的包含子字符串的个数实现代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持PHP中文网。 更多java查找字符串中的包含子字符串的个数实现代码相关文章请... -
java 查找子串算法_子字符串查找之————关于KMP算法你不知道的事
2021-02-28 09:30:54图1 和模式字符串ABABAC对应的确定有限状态机自动机 图一展示了模式字符串pat:ABABAC对应的确定有限状态机自动机 dfa[A][j]表示:模式串成功匹配到第j个位置时文本这时对应字符为'A'的情况下模式串下一个将要匹配...