一、Python中字符串長度計算
在Python中,計算字符串長度有多種方式。最基本的方式是使用內置函數len()
。該函數可以計算字符串中的字符數量,包括空格、標點等。示例代碼如下:
str1 = "Hello world!"
print(len(str1)) # 輸出 12
除了len()
函數,還可以使用字符串對象的__len__()
方法計算長度:
str1 = "Hello world!"
print(str1.__len__()) # 輸出 12
如果需要計算字符串中不重復字符的數量,可以使用set集合。將字符串轉換為set集合后,set集合中元素數量就是不重復字符的數量。示例代碼如下:
str1 = "Hello world!"
print(len(set(str1))) # 輸出 10
二、Pyspark中字符串長度計算
在Pyspark中,計算字符串長度也有多種方式。最常見的方式是使用length()
函數。
from pyspark.sql.functions import length
df = spark.createDataFrame([(1, "Hello world!")], ["id", "text"])
df = df.withColumn("length", length(df["text"]))
df.show()
運行結果如下:
+---+------------+------+
| id| text|length|
+---+------------+------+
| 1|Hello world!| 12|
+---+------------+------+
除了length()
函數,還有char_lengh()
函數可以計算字符串長度。該函數只計算字符串中字符的數量。示例代碼如下:
from pyspark.sql.functions import char_length
df = spark.createDataFrame([(1, "Hello world!")], ["id", "text"])
df = df.withColumn("length", char_length(df["text"]))
df.show()
運行結果如下:
+---+------------+------+
| id| text|length|
+---+------------+------+
| 1|Hello world!| 12|
+---+------------+------+
三、小結
無論是在Python中還是Pyspark中,計算字符串長度都非常簡單。Python中可以使用內置函數len()
或者__len__()
方法,Pyspark中可以使用length()
函數或者char_length()
函數。根據需求選擇相應的函數即可。