jQuery选择器源码解读(三):tokenize方法
程序员文章站
2023-10-28 14:26:04
jquery选择器解读(三):tokenize方法。
/*
* tokenize方法是选择器解析的核心函数,它将选择器转换成两级数组groups
* 举例:
*...
jquery选择器解读(三):tokenize方法。
/* * tokenize方法是选择器解析的核心函数,它将选择器转换成两级数组groups * 举例: * 若选择器为“p.class,span”,则解析后的结果为: * group[0][0] = {type:'tag',value:'p',matches:match} * group[0][1] = {type:'class',value:'.class',matches:match} * group[1][0] = {type:'tag',value:'span',matches:match} * 由上述结果可以看出,groups的每一个元素以逗号分隔的选择器块的解析结果, * 另外,上述结果中的matches等于模式匹配的结果,由于在此不方便写清楚, * 故只把代码matches:match写在这里。 * * tokenize方法完成如下两个主要任务: * 1、解析选择器 * 2、将解析结果存入缓存中,以备后用 * * * @param selector 待解析的选择器字符串 * @param parseonly 为true时,说明本次调用是匹配子选择器 * 举个例子:若初始选择器为"p:not(.class:not(:eq(4))):eq(3)" * 代码首先匹配出tag选择器p, * 之后匹配出的pseudo选择器字符串是:not(.class:not(:eq(4))):eq(3), * 代码会把“.class:not(:eq(4))):eq(3”作为not的括号内的值进一步进行解析, * 此时代码在调用tokenize解析时,parseonly参数会传入true. */ function tokenize(selector, parseonly) { var matched, match, tokens, type, sofar, groups, prefilters, // 获取缓存中的结果 cached = tokencache[selector + " "]; /* * 若缓存中有selector对应的解析结果 * 则执行if中语句体 */ if (cached) { // 若是对初始选择器解析(parseonly!=true),则返回缓存结果, // 若不是,则返回0 return parseonly ? 0 : cached.slice(0); } /* * 由于字符串在javascript中不是作为对象来处理的, * 所以通过赋值,代码就自动复制了一个新字符串给了sofar, * 这样,对sofar的任何处理都不会影响selector的原有数据 */ sofar = selector; groups = []; // 此处赋值,仅仅用于减少后续代码字数,缩短执行路径 prefilters = expr.prefilter; while (sofar) { // comma and first run /* * rcomma = new regexp("^" + whitespace + "*," + whitespace + "*") * rcomma用来判定是否存在多个选择器块,即用逗号隔开的多个并列的选择器 * * 下面条件判定依次为: * !matched:若是第一次执行循环体,则为true;否则为false。 * 这里matched即作为是否第一次执行循环体的标识, * 也作为本次循环中sofar是否以非法字符串(即非合法单一选择器)开头的标志。 * (match = rcomma.exec(sofar):获取符合rcomma的匹配项 */ if (!matched || (match = rcomma.exec(sofar))) { if (match) { // don't consume trailing commas as valid /* * 剔除掉第一个逗号及之前的所有字符 * 举个例子: * 若初始选择器为:"p.news,span.closed", * 在解析过程中,首先由后续代码解析完毕p.news,剩下",span.closed" * 在循环体内执行到这里时,将逗号及之前之后连续的空白(match[0])删除掉, * 使sofar变成"span.closed",继续执行解析过程 * * 在这里,若初始选择器的最后一个非空白字符是逗号, * 那么执行下面代码时sofar不变,即sofar.slice(match[0].length)返回空字符串, * 故最终返回的是||后面的sofar */ sofar = sofar.slice(match[0].length) || sofar; } /* * 在第一次执行循环体或者遇到逗号分割符时,将tokens赋值为一个空数组, * 同时压入groups数组 */ groups.push(tokens = []); } matched = false; // combinators /* * rcombinators = new regexp( * "^" + whitespace + "*([>+~]|" + whitespace + ")" + whitespace + "*"), * rcombinators用来匹配四种关系符,即>+~和空白 * * 若sofar中是以关系符开始的,则执行if内的语句体 */ if ((match = rcombinators.exec(sofar))) { /* * 将match[0]移除match数组,同时将它赋予matched * 若原本关系符两边带有空格,则此时match[0]与matched是不相等的 * 举个例子: * 若sofar = " + .p"; * 执行match = rcombinators.exec(sofar)后, * match[0] = " + ",而match[1]="+"; * 执行完matched = match.shift()后, * matched=" + ",而match[0]="+"; */ matched = match.shift(); // 将匹配结果压入tokens数组中 tokens.push({ value : matched, // cast descendant combinators to space /* * rtrim = new regexp("^" + whitespace + "+|((?:^|[^\\\\])(?:\\\\.)*)" * + whitespace + "+$", "g"), * whitespace = "[\\x20\\t\\r\\n\\f]"; * * 下面match[0].replace(rtrim, " ")的作用是将match[0]左右两边的空白替换为空格 * 但是由于其上的match.shift的作用,match[0]已经是两边不带空白的字符串了, * 故此出的替换是没有用途的代码 */ type : match[0].replace(rtrim, " ") }); // 将关系符之后的字符串赋予sofar,继续解析 sofar = sofar.slice(matched.length); } // filters /* * 下面通过for语句对sofar逐一匹配id、tag、class、child、attr、pseudo类型的选择器 * 若匹配到了,则先调用该类型选择器对应的预过滤函数, * 然后,将结果压入tokens数组,继续本次循环。 */ for (type in expr.filter) { /* * match = matchexpr[type].exec(sofar):对sofar调用type类型的正则表达式对sofar进行匹配, * 并将匹配结果赋予match。若未匹配到数据,则match为undefined。 * !prefilters[type]:若不存在type类型的预过滤函数,则为true * match = prefilters[type](match):执行预过滤,并将结果返回给match * */ if ((match = matchexpr[type].exec(sofar)) && (!prefilters[type] || (match = prefilters[type] (match)))) { // 将match[0]移除match数组,同时将它赋予matched matched = match.shift(); // 将匹配结果压入tokens数组中 tokens.push({ value : matched, type : type, matches : match }); // 将匹配结果之后的字符串赋予sofar,继续解析 sofar = sofar.slice(matched.length); } } /* * 若matched==false, * 则说明本次循环没有有效的选择器(包括关系符和id、class等类型选择器) * 因此,解析到当前位置遗留下来的sofar是非法的选择器字符串 * 跳出while循环体 */ if (!matched) { break; } } // return the length of the invalid excess // if we're just parsing // otherwise, throw an error or return tokens /* * 若不是对初始选择器字符串进行解析(!parseonly==true), * 则返回sofar.length,此时的sofar.length代表连续有效的选择器最终位置, * 后续文章将以实例进行说明 * 若是对初始选择器字符串进行解析,则看sofar是否还有字符, * 若是,则执行sizzle.error(selector)抛出异常; * 若不是,则执行tokencache(selector, groups).slice(0)将结果压入缓存,并返回结果的副本。 */ return parseonly ? sofar.length : sofar ? sizzle.error(selector) : // cache the tokens tokencache(selector, groups).slice(0); }
推荐阅读
-
jQuery选择器源码解读(四):tokenize方法的Expr.preFilter
-
jQuery选择器源码解读(二):select方法
-
jQuery选择器源码解读(一):Sizzle方法
-
jQuery选择器源码解读(三):tokenize方法
-
jQuery选择器源码解读(五):tokenize的解析过程
-
jQuery 源码解析(三) pushStack方法 详解
-
jQuery源码解读之extend()与工具方法、实例方法详解
-
jQuery选择器源码解读(八):addCombinator函数
-
jQuery选择器源码解读(七):elementMatcher函数
-
jQuery选择器源码解读(一):Sizzle方法