过人科技网

# 默认不保留换行符'ab c\n\nde fg\rkl\r\n'

简介: # 默认不保留换行符'ab c\n\nde fg\rkl\r\n'.splitlines()>>> ['ab c', '', 'de fg', 'kl']'ab c\n\nde fg\rkl\r\n'.splitlin

作者 | 豌豆花下猫责编 | 郭芮Python 中字符串是由 Uniocde 编码的字符组成的不可变序列,它具备与其它序列共有的一些操作,例如判断元素是否存在、拼接序列、切片操作、求长度、求最值、求元素的索引位置及出现次数等等。

本文主要介绍 Python 字符串特有的操作方法,比如它的拼接、拆分、替换、查找及字符判断等使用方法,辨析了一些可能的误区。

最后,还做了两个扩展思考:为什么 Python 字符串不具备列表类型的某些操作呢,为什么它不具备 Ja 字符串的一些操作呢?

两相比较,希望能帮助你透彻地理解——Python 的字符串到底怎么用?

拼接字符串字符串的拼接操作最常用,七种拼接方式从实现原理上划分为三类,即格式化类(%占位符、format()、template)、拼接类(+操作符、类元祖方式、join())与插值类(f-string),在使用上,我有如下建议:当要处理字符串列表等序列结构时,采用join()方式;拼接长度不超过20时,选用+号操作符方式;长度超过20的情况,高版本选用f-string,低版本时看情况使用format()或join()方式。

比如在拼接 SQL 语句的时候,经常要根据不同的条件分支,来组装不同的查询语句,而且还得插入不同的变量值,所以当面临这种复杂的场景时,传统拼接方式只会加剧代码的复杂度、降低可读性和维护性。

拆分字符串在字符串的几种拼接方法中,join() 方法可以将列表中的字符串元素,拼接成一个长的字符串,与此相反,split() 方法可以将长字符串拆分成一个列表。

split() 方法可接收两个参数,第一个参数是分隔符,即用来分隔字符串的字符,默认是所有的空字符,包括空格、换行(\n)、制表符(\t)等。

s = 'Hello world'l = '''Hi there , my name is Python猫Do you like me ?'''# 不传参数时,默认分隔符为所有空字符s.split() >>> ['Hello', 'world']s.split(' ') >>> ['Hello', 'world']s.split(' ') >>> ['Hello world'] # 不存在两个空格符s.split('world') >>> ['Hello', '']# 空字符包括空格、多个空格、换行符等l.split() >>> ['Hi', 'there', ',', 'my', 'name', 'is', 'Python猫', 'Do', 'you', 'like', 'me', '?']split() 方法的第二个参数是一个数字,默认是缺省,缺省时全分隔,也可以用 maxsplit 来指定拆分次数。

# 按位置传参l.split(' ',3)>>> ['Hi', 'there', ',', 'my name is Python 猫\nDo you like me ?\n']# 指定传参l.split(maxsplit=3)>>> ['Hi', 'there', ',', 'my name is Python 猫\nDo you like me ?\n']# 错误用法l.split(3)---------------TypeError Traceback (most recent call last) in ()----> 1 l.split(3)TypeError: must be str or None, not intsplit() 方法是从左往右遍历,与之相对,rsplit() 方法是从右往左遍历,比较少用,但是会有奇效。

拆分字符串还有一种方法,即 splitlines() ,这个方法会按行拆分字符串,它接收一个参数 True 或 False,分别决定换行符是否会被保留,默认值 False,即不保留换行符。

# 默认不保留换行符'ab c\n\nde fg\rkl\r\n'.splitlines()>>> ['ab c', '', 'de fg', 'kl']'ab c\n\nde fg\rkl\r\n'.splitlines(True)>>> ['ab c\n', '\n', 'de fg\r', 'kl\r\n']替换字符串替换字符串包括如下场景:大小写替换、特定符号替换、自定义片段替换…

这里只说说 strip() 方法,它比较常用,可以去除字符串前后的空格,不仅如此,它还可以删除首末位置的指定的字符。

s = '******Hello world******'s.strip('*') >>> 'Hello world'查找字符串查找字符串中是否包含某些内容,这是挺常用的操作。

Python 中有多种实现方式,例如内置的 find() 方法,但是这个方法并不常用,因为它仅仅告诉你所查找内容的索引位置,而在通常情况下,这个位置并不是我们的目的。

find() 方法与 index() 方法的效果一样,它们的最大的区别只在于,找不到内容时的返回值不同,一个返回 -1,一个抛出异常 :s = 'Hello world's.find('cat') >>> -1s.index('cat') >>> ValueError Traceback (most recent call last) in ()----> 1 s.index('cat')ValueError: substring not found以上两个方法,只能用来满足最简单的查找需求。

正则表达式和 re 模块就是这样的工具,正则表达式用来定制匹配规则,re 模块则了 match() 、find() 及 findall() 等方法,它们组合起来,可以实现复杂的查找功能。

限于篇幅,今后再对这两大工具做详细介绍,这里有一个简单的例子:import redatepat = re.compile(r'\d+/\d+/\d+')text = 'Today is 11/21/2018. Tomorrow is 11/22/2018.'datepat.findall(text)>>> ['11/21/2018', '11/22/2018']字符判断判断字符串是否(只)包含某些字符内容,这类使用场景也很常见,例如在网站注册时,要求用户名只能包含英文字母和数字,那么,当校验输入内容时,就需要判断它是否只包含这些字符。

其它常用的判断操作,详列如下:字符串不可以做的事上文内容都是 Python 字符串特有的操作方法,相信读完之后,你更清楚知道 Python 能够做什么了。

但是,这还不足以回答本文标题的问题——你真的知道 Python 的字符串怎么用吗?

尽管如此,为了体现严谨性,我试着再聊聊“Python 字符串不可以做的事”,从相反的维度来补充回答这个问题。

下面是开拓思维,进行头脑风暴的时刻:(1)受限的序列与典型的序列类型相比,字符串不具备列表的如下操作:append()、clear()、copy()、insert()、pop()、remove(),等等。

有几个很好理解,即append()、insert()、pop() 和 remove()都是对单个元素的操作,但是字符串中的单个元素就是单个字符,通常没有任何意义,我们也不会频繁对其做增删操作,所以字符串没有这几个方法也算合理。

列表的 clear() 方法会清空列表,用来节省内存空间,效果等于anylist[:] = [],但是,奇怪的是,Python 并不支持清空/删除操作。

首先,字符串没有 clear() 方法,其次,它是不可变对象,不支持这种赋值操作anystr[:] = '',也不支持del anystr[:]操作:s = 'Hello world's[:] = ''>>> 报错:TypeError:'str' object does not support item assignmentdel s[:]>>> 报错:TypeError:'str' object does not support item deletion当然,你也别想通过del s来删除字符串,因为变量名 s 只是字符串对象的引用(挖坑,以后写写这个话题),只是一个标签,删除标签并不会直接导致对象实体的消亡。

如此看来,想要手动清空/删除 Python 字符串,似乎是无解。

最后还有一个 copy() 方法,这就是拷贝嘛,可是字符串也没有这个方法。

(2)比就比,谁怕谁接下来,又到了 Python 字符串与 Ja 字符串 PK 的时刻。

在对象定义的角度上,Python 的确更胜一筹,这次看看会比出个啥结果吧。

Ja 中有比较字符串的方法,即 compareTo() 方法与 equals() 方法,前一个方法逐一比较两个字符串的字符编码,返回一个整型的差值,后一个方法在整体上比较两个字符串的内容是否相等。

Python 字符串没有这两个单独的方法,但要实现类似的功能却很简便。

先看例子:myName = "Python猫"cmpName = "world"newName = myName# 直接用比较符号进行comparemyName > cmpName >>> FalsemyName == newName>>> TruecmpName != newName>>> True# 比较是否同一对象myName is cmpName>>> FalsemyName is newName>>> True上例中,如果把赋值的字符串换成列表或者其它对象,这些比较操作也是可以进行的。

也就是说,作比较的能力是 Python 公民们的一项基本能力,并不会因为你是字符串就给你设限,或者给你开特权。

与此类似,Python 公民们自带求自身长度的能力,len() 方法是内置方法,可以直接传入任意序列参数,求解长度。

Ja 中则要求不同的序列对象,只能调用各自的 length() 方法。

说个形象的比喻,Python 用一把秤,三教九流之辈都能拿它称重,而Ja 中有多把秤,你称你的,我称我的,大家“井水不犯河水”。

Python 中曾经有 cmp() 方法和__cmp__()魔术方法,但官方嫌弃它们鸡肋,所以在Python 3 中移除掉了。

虽然在 operator 模块中还为它留下了一脉香火,但保不定哪天就会彻底废弃。

import operatoroperator.eq('hello', 'name')>>> Falseoperator.eq('hello', 'hello')>>> Trueoperator.gt('hello', 'name')>>> Falseoperator.lt('hello', 'name')>>> True(3)墙上的门在 Ja 中,字符串还有一个强大的 valueOf() 方法,它可以接收多种类型的参数,如boolean、char、char数组、double、float、int等等,然后返回这些参数的字符串类型。

例如,要把 int 转为字符串,可以用 String.valueOf(anynum) 。

Python 字符串依然没有这个单独的方法,但要实现相同的功能却很简便。

对Python来说,不同的数据类型转换成字符串,那是小菜一碟,例如:str(123) >>> '123'str(True) >>> 'True'str(1.22) >>> '1.22'str([1,2]) >>> '[1, 2]'str({'name':'python', 'sex':'male'})>>> "{'name': 'python', 'sex': 'male'}"而从字符串转换为其它类型也不难,例如,int('123') 即可由字符串'123'得到数字 123。

对比 Ja,这个操作要写成 Integer.parseInt('123')。

在Ja 的不同数据类型之间,那道分隔之墙矗立得很高,仿佛需要借助一座更高的吊桥才能沟通两边,而在灵活的 Python 里,你可以很方便地打开墙上的那扇门,来往穿越。

小结一下,跟 Ja 相比,Python 字符串确实没有几项方法,但是事出有因,它们的天赋能力可不弱,所有这些操作都能简明地实现。

一方面,Python 字符串做不到某些事,但是另一方面,Python 可以出色地做成这些事,孰优孰劣,高下立判。

总结写文章贵在善始善终,现在给大家总结一下:本文主要介绍 Python 字符串特有的操作方法,比如它的拼接、拆分、替换、查找及字符判断等使用方法,从正向回答,Python 字符串能做什么?

最后,我们还从反向来回答了 Python 字符串不能做什么?

有些不能做,实际上是 不为,是为了在其它地方更好地作为,归根到底,应该有的功能,Python 字符串全都有了。

本文中还将 Python 与 Ja 做了比较,有几项小小的差异,背后反映的其实是,两套语言系统在世界观上的差异。

无业务不技术:那些誓用区块链重塑的行业,发展怎么样了?

');NSLog(@"点个好看吧!

");console.log("点个好看吧!

\n");cout << "点个好看吧!

" << endl;Console.WriteLine("点个好看吧!

")echo "点个好看吧!


以上是文章"

# 默认不保留换行符'ab c\n\nde fg\rkl\r\n'

"的内容,欢迎阅读过人科技网的其它文章