Как удалить дубликаты из списка в Python
Python удалить дубликаты из списка
Список — это контейнер, содержащий различные Python объекты, которые могут быть целыми числами, словами, значениями и т. д. Это эквивалент массива в других языках программирования.
Итак, здесь мы рассмотрим различные способы удаления дубликатов из заданного списка в Python.
Способ 1) Удалить дубликаты из списка с помощью Set
Чтобы удалить дубликаты из списка, вы можете использовать встроенную функцию set(). Особенность метода set() заключается в том, что он возвращает отдельные элементы.
У нас есть список: [1,1,2,3,2,2,4,5,6,2,1]. В списке много дубликатов, которые нам нужно удалить и вернуть только отдельные элементы. Список передается set() встроенная функция. Later окончательный список отображается с помощью list() встроенная функция, как показано в примере ниже.
На выходе мы получаем отдельные элементы, из которых исключены все повторяющиеся элементы.
Пример
my_list = [1,1,2,3,2,2,4,5,6,2,1] my_final_list = set(my_list) print(list(my_final_list))
Вывод:
[1, 2, 3, 4, 5, 6]
Способ 2) Использование временного списка
Чтобы удалить дубликаты из данного list, вы можете использовать пустой временный список. Для этого сначала вам придется просмотреть список, содержащий дубликаты, и добавить уникальные элементы во временный список. Later временный список присваивается основному списку.
Пример
Вот рабочий пример использования временного списка.
my_list = [1, 2, 3, 1, 2, 4, 5, 4 ,6, 2]
print("List Before ", my_list)
temp_list = []
for i in my_list:
if i not in temp_list:
temp_list.append(i)
my_list = temp_list
print("List After removing duplicates ", my_list)
Вывод:
List Before [1, 2, 3, 1, 2, 4, 5, 4, 6, 2] List After removing duplicates [1, 2, 3, 4, 5, 6]
Способ 3) Использование Dict
Мы можем удалить дубликаты из данного списка, импортировав OrderedDict из коллекций. Он доступен начиная с Python2.7. OrderedDict позаботится о том, чтобы вернуть вам отдельные элементы в том порядке, в котором присутствует ключ.
Давайте воспользуемся списком и воспользуемся fromkeys() метод, доступный в OrderedDict, для получения уникальных элементов из списка.
Чтобы использовать OrderedDict.fromkey() вам необходимо импортировать OrderedDict из коллекций, как показано ниже:
from collections import OrderedDict
Вот пример удаления дубликатов с помощью OrderedDict.fromkeys() метод.
Пример
from collections import OrderedDict my_list = ['a','x','a','y','a','b','b','c'] my_final_list = OrderedDict.fromkeys(my_list) print(list(my_final_list))
Вывод:
['a', 'x', 'y', 'b', 'c']
С Python 3.5+ и выше, мы можем использовать обычный dict.fromkeys() чтобы получить отдельные элементы из списка. dict.fromkeys() методы возвращают уникальные ключи и помогают избавиться от повторяющихся значений.
Пример, демонстрирующий работу dict.fromkeys() Список уникальных предметов выглядит следующим образом:
Пример
my_list = ['a','x','a','y','a','b','b','c'] my_final_list = dict.fromkeys(my_list) print(list(my_final_list))
Вывод:
['a', 'x', 'y', 'b', 'c']
Способ 4) Использование цикла for
. для цикла, мы пройдемся по списку элементов, чтобы удалить дубликаты.
Сначала инициализируйте массив пустым, т.е. myFinallist = [].Внутри цикла for добавьте проверку, существуют ли элементы списка в массиве. myFinallist. Если элементы не существуют, добавьте элемент в массив myFinallist, используя команду append() метод.
Таким образом, всякий раз, когда встречается повторяющийся элемент, он уже присутствует в массиве myFinallist и не будет вставлен. Давайте теперь проверим то же самое на примере ниже:
Пример
my_list = [1,2,2,3,1,4,5,1,2,6]
myFinallist = []
for i in my_list:
if i not in myFinallist:
myFinallist.append(i)
print(list(myFinallist))
Вывод:
[1, 2, 3, 4, 5, 6]
Метод 5) Использование понимания списка
Понимание списков Python функции, используемые для создания новых последовательностей (например, списков, словарей и т. д.) с использованием уже созданных последовательностей. Это поможет вам сократить длинные циклы и упростить чтение и поддержку вашего кода.
Давайте воспользуемся пониманием списка, чтобы удалить дубликаты из данного списка.
Пример
my_list = [1,2,2,3,1,4,5,1,2,6] my_finallist = [] [my_finallist.append(n) for n in my_list if n not in my_finallist] print(my_finallist)
Вывод:
[1, 2, 3, 4, 5, 6]
Метод 6) Использование метода Numpy unique().
Способ unique() из модуля Numpy может помочь нам удалить дубликаты из данного списка.
Чтобы работать с модулем Numpy first import numpy, вам необходимо выполнить следующие шаги:
Шаг 1) Импортировать модуль Numpy
import numpy as np
Шаг 2) Используйте свой список с дубликатами внутри уникального метода, как показано ниже. Вывод преобразуется обратно в формат списка с помощью tolist() метод.
myFinalList = np.unique(my_list).tolist()
Шаг 3) Наконец, распечатайте список, как показано ниже:
print(myFinalList)
Окончательный код с выводом выглядит следующим образом:
import numpy as np my_list = [1,2,2,3,1,4,5,1,2,6] myFinalList = np.unique(my_list).tolist() print(myFinalList)
Вывод:
[1, 2, 3, 4, 5, 6]
Способ 7) Использование методов Pandas
Модуль Pandas имеет unique() метод, который даст нам уникальные элементы из данного списка.
Для работы с модулем Pandas вам необходимо выполнить следующие действия:
Шаг 1) Импортировать модуль Pandas
import pandas as pd
Шаг 2) Используйте свой список с дубликатами внутри unique() метод, как показано ниже:
myFinalList = pd.unique(my_list).tolist()
Шаг 3) Распечатайте список, как показано ниже:
print(myFinalList)
Окончательный код с выводом выглядит следующим образом:
import pandas as pd my_list = [1,2,2,3,1,4,5,1,2,6] myFinalList = pd.unique(my_list).tolist() print(myFinalList)
Вывод:
[1, 2, 3, 4, 5, 6]
Метод 8) Использование enumerate() и понимания списка
Здесь комбинация понимания списка и перечисления для удаления повторяющихся элементов. Enumerate возвращает объект со счетчиком для каждого элемента в списке. Например (0,1), (1,2) и т. д. Здесь первое значение — это индекс, а второе значение — элемент списка. Вт
Каждый элемент проверяется, существует ли он в списке, и если есть, он удаляется из списка.
Пример
my_list = [1,2,2,3,1,4,5,1,2,6] my_finallist = [i for j, i in enumerate(my_list) if i not in my_list[:j]] print(list(my_finallist))
Вывод:
[1, 2, 3, 4, 5, 6]
Резюме
- Чтобы удалить дубликаты из списка, вы можете использовать встроенную функцию
set(). Специальностьset()заключается в том, что он возвращает отдельные элементы. - Вы можете удалить дубликаты из данного списка, импортировав
OrderedDictfromколлекции. Он доступен начиная с Python2.7.OrderedDictdictпозаботится о том, чтобы вернуть вам отдельные элементы в том порядке, в котором присутствует ключ. - Вы можете использовать цикл for, который будет проходить по списку элементов для удаления дубликатов.
- Способ
unique()из модуля Numpy может помочь нам удалить дубликаты из данного списка. - Модуль Pandas имеет
unique()метод, который даст нам уникальные элементы из данного списка. - Комбинация понимания списка и перечисления используется для удаления повторяющихся элементов из списка. Enumerate возвращает объект со счетчиком для каждого элемента в списке.
