W tym samouczku nauczysz się tworzyć, formatować, modyfikować i usuwać ciągi znaków w Pythonie. Zostaniesz również wprowadzony w różne operacje i funkcje na łańcuchach.
Wideo: Python Strings
Co to jest ciąg znaków w Pythonie?
Ciąg to sekwencja znaków.
Postać to po prostu symbol. Na przykład język angielski ma 26 znaków.
Komputery nie zajmują się znakami, lecz liczbami (binarnymi). Mimo że możesz zobaczyć znaki na ekranie, wewnętrznie jest on przechowywany i przetwarzany jako kombinacja zer i jedynek.
Ta konwersja znaku na liczbę nazywa się kodowaniem, a proces odwrotny to dekodowanie. ASCII i Unicode to tylko niektóre z popularnych używanych kodowań.
W Pythonie ciąg to sekwencja znaków Unicode. Unicode został wprowadzony w celu uwzględnienia wszystkich znaków we wszystkich językach i zapewnienia jednolitości kodowania. Możesz dowiedzieć się o Unicode z Python Unicode.
Jak stworzyć string w Pythonie?
Ciągi można tworzyć, umieszczając znaki w pojedynczym cudzysłowie lub w cudzysłowie. Nawet potrójne cudzysłowy mogą być używane w Pythonie, ale ogólnie są używane do reprezentowania wielowierszowych ciągów znaków i dokumentów.
# defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)
Po uruchomieniu programu wynik będzie następujący:
Hello Hello Hello Hello, witaj w świecie Pythona
Jak uzyskać dostęp do znaków w ciągu?
Możemy uzyskać dostęp do poszczególnych znaków za pomocą indeksowania i zakresu znaków za pomocą wycinania. Indeks zaczyna się od 0. Próba uzyskania dostępu do znaku spoza zakresu indeksu spowoduje zgłoszenie IndexError
. Indeks musi być liczbą całkowitą. Nie możemy używać pływaków ani innych typów, spowoduje to TypeError
.
Python pozwala na ujemne indeksowanie swoich sekwencji.
Indeks -1
odnosi się do ostatniej pozycji, -2
do przedostatniej pozycji i tak dalej. Możemy uzyskać dostęp do szeregu elementów w ciągu za pomocą operatora krojenia :
(dwukropek).
#Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))
Po uruchomieniu powyższego programu otrzymujemy następujący wynik:
str = programiz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am
Jeśli spróbujemy uzyskać dostęp do indeksu spoza zakresu lub użyjemy liczb innych niż liczba całkowita, otrzymamy błędy.
# index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers
Krojenie można najlepiej zwizualizować, rozważając, że indeks znajduje się między elementami, jak pokazano poniżej.
Jeśli chcemy uzyskać dostęp do zakresu, potrzebujemy indeksu, który wycina część ciągu.

Jak zmienić lub usunąć ciąg?
Ciągi znaków są niezmienne. Oznacza to, że po przypisaniu elementów łańcucha nie można zmienić. Możemy po prostu ponownie przypisać różne ciągi do tej samej nazwy.
>>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'
Nie możemy usuwać ani usuwać znaków z ciągu. Ale całkowite usunięcie ciągu jest możliwe za pomocą del
słowa kluczowego.
>>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined
Operacje na łańcuchach w Pythonie
Istnieje wiele operacji, które można wykonać za pomocą łańcuchów, co sprawia, że jest to jeden z najczęściej używanych typów danych w Pythonie.
Aby dowiedzieć się więcej o typach danych dostępnych w Pythonie, odwiedź: Python Data Types
Łączenie dwóch lub więcej ciągów
Łączenie dwóch lub więcej ciągów w jeden nazywa się konkatenacją.
+ Operator ma to w Pythonie. Zwykłe zapisanie dwóch literałów tekstowych razem również je łączy.
* Operator może być używany, aby powtórzyć ciąg dla danego liczbę razy.
# Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)
Po uruchomieniu powyższego programu otrzymujemy następujący wynik:
str1 + str2 = HelloWorld! str1 * 3 = HelloHelloHello
Zapisanie razem dwóch literałów łańcuchowych również powoduje ich konkatenację, podobnie jak operator + .
Jeśli chcemy połączyć ciągi w różnych wierszach, możemy użyć nawiasów.
>>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'
Iterowanie przez ciąg
Możemy iterować po ciągu za pomocą pętli for. Oto przykład, aby policzyć liczbę l w ciągu.
# Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')
Po uruchomieniu powyższego programu otrzymujemy następujący wynik:
Znaleziono 3 litery
Test członkostwa w łańcuchu
We can test if a substring exists within a string or not, using the keyword in
.
>>> 'a' in 'program' True >>> 'at' not in 'battle' False
Built-in functions to Work with Python
Various built-in functions that work with sequence work with strings as well.
Some of the commonly used ones are enumerate()
and len()
. The enumerate()
function returns an enumerate object. It contains the index and value of all the items in the string as pairs. This can be useful for iteration.
Similarly, len()
returns the length (number of characters) of the string.
str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))
When we run the above program, we get the following output:
list(enumerate(str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len(str) = 4
Python String Formatting
Escape Sequence
If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError
as the text itself contains both single and double quotes.
>>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax
One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.
An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.
# using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")
When we run the above program, we get the following output:
He said, "What's there?" He said, "What's there?" He said, "What's there?"
Here is a list of all the escape sequences supported by Python.
Escape Sequence | Description |
---|---|
ewline | Backslash and newline ignored |
\ | Backslash |
\' | Single quote |
" | Double quote |
a | ASCII Bell |
ASCII Backspace | |
f | ASCII Formfeed |
ASCII Linefeed | |
ASCII Carriage Return | |
ASCII Horizontal Tab | |
v | ASCII Vertical Tab |
ooo | Character with octal value ooo |
xHH | Character with hexadecimal value HH |
Here are some examples
>>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation
Raw String to ignore escape sequence
Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r
or R
in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.
>>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example
The format() Method for Formatting Strings
The format()
method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces ()
as placeholders or replacement fields which get replaced.
We can use positional arguments or keyword arguments to specify the order.
# Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)
When we run the above program, we get the following output:
--- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John
The format()
method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <
, right-justify >
or center ^
a string in the given space.
Możemy również formatować liczby całkowite jako binarne, szesnastkowe itp., A liczby zmiennoprzecinkowe mogą być zaokrąglane lub wyświetlane w formacie wykładniczym. Istnieje mnóstwo formatowania, którego możesz użyć. Odwiedź tutaj, aby zapoznać się z całym formatowaniem ciągów dostępnym w tej format()
metodzie.
>>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'
Formatowanie w starym stylu
Możemy nawet formatować łańcuchy, jak w starym sprintf()
stylu używanym w języku programowania C. %
Aby to osiągnąć, używamy operatora.
>>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457
Popularne metody ciągów znaków w języku Python
Istnieje wiele metod dostępnych w przypadku obiektu string. format()
Sposób, że wymienione powyżej jest jednym z nich. Niektóre z powszechnie stosowanych metod są lower()
, upper()
, join()
, split()
, find()
, replace()
itd. Powyżej znajduje się pełna lista wszystkich wbudowanych metod do pracy z ciągów znaków w Pythonie.
>>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'