Cómo fusionar 2 List <T> y eliminar valores duplicados en C #


159

Tengo dos listas de listas que necesito combinar en la tercera lista y eliminar valores duplicados de esas listas

Un poco difícil de explicar, así que permítanme mostrar un ejemplo de cómo se ve el código y lo que quiero como resultado, en la muestra utilizo el tipo int no la clase ResultAnalysisFileSql.

first_list = [1, 12, 12, 5]

second_list = [12, 5, 7, 9, 1]

El resultado de combinar las dos listas debe dar como resultado esta lista: result_list = [1, 12, 5, 7, 9]

Notará que el resultado tiene la primera lista, incluidos sus dos valores "12", y en second_list tiene un valor adicional de 12, 1 y 5.

Clase ResultAnalysisFileSql

[Serializable]
    public partial class ResultAnalysisFileSql
    {
        public string FileSql { get; set; }

        public string PathFileSql { get; set; }

        public List<ErrorAnalysisSql> Errors { get; set; }

        public List<WarningAnalysisSql> Warnings{ get; set; }

        public ResultAnalysisFileSql()
        {

        }

        public ResultAnalysisFileSql(string fileSql)
        {
            if (string.IsNullOrEmpty(fileSql)
                || fileSql.Trim().Length == 0)
            {
                throw new ArgumentNullException("fileSql", "fileSql is null");
            }

            if (!fileSql.EndsWith(Utility.ExtensionFicherosErrorYWarning))
            {
                throw new ArgumentOutOfRangeException("fileSql", "Ruta de fichero Sql no tiene extensión " + Utility.ExtensionFicherosErrorYWarning);
            }

            PathFileSql = fileSql;
            FileSql = ObtenerNombreFicheroSql(fileSql);
            Errors = new List<ErrorAnalysisSql>();
            Warnings= new List<WarningAnalysisSql>();
        }

        private string ObtenerNombreFicheroSql(string fileSql)
        {
            var f = Path.GetFileName(fileSql);
            return f.Substring(0, f.IndexOf(Utility.ExtensionFicherosErrorYWarning));
        }


        public override bool Equals(object obj)
        {
            if (obj == null)
                return false;
            if (!(obj is ResultAnalysisFileSql))
                return false;

            var t = obj as ResultAnalysisFileSql;
            return t.FileSql== this.FileSql
                && t.PathFileSql == this.PathFileSql
                && t.Errors.Count == this.Errors.Count
                && t.Warnings.Count == this.Warnings.Count;
        }


    }

¿Algún código de muestra para combinar y eliminar duplicados?

Respuestas:


288

¿Has echado un vistazo a Enumerable.Union

Este método excluye duplicados del conjunto de devolución . Este es un comportamiento diferente al método Concat, que devuelve todos los elementos en las secuencias de entrada, incluidos los duplicados.

List<int> list1 = new List<int> { 1, 12, 12, 5};
List<int> list2 = new List<int> { 12, 5, 7, 9, 1 };
List<int> ulist = list1.Union(list2).ToList();

// ulist output : 1, 12, 5, 7, 9

66
@Dr TJ: ¿Tu clase personal implementa IEqualityComparer <T>? Si es así, deberá verificar sus métodos GetHashCode e Equals. Consulte la sección Comentarios de msdn.microsoft.com/en-us/library/bb341731.aspx .
Tomás Narros

1
Es importante tener en cuenta porque me encontré con problemas al usar esto en 2 colecciones diferentes: "No se pueden unir dos tipos diferentes, a menos que uno herede del otro" de stackoverflow.com/a/6884940/410937 que produjo un cannot be inferred from the usageerror.
atconway

30

por qué no simplemente, por ejemplo

var newList = list1.Union(list2)/*.Distinct()*//*.ToList()*/;

oh ... según msdn puedes omitir el.Distinct()

Este método excluye duplicados del conjunto de devolución


25

La unión no tiene un buen desempeño: este artículo describe cómo compararlos

var dict = list2.ToDictionary(p => p.Number);
foreach (var person in list1)
{
        dict[person.Number] = person;
}
var merged = dict.Values.ToList();

Listas y combinación de LINQ: 4820 ms Fusión de
diccionario: 16
ms HashSet y IEqualityComparer: 20 ms
LINQ Union e IEqualityComparer: 24 ms


1
También otro beneficio de usar una combinación de diccionario -> Tengo dos listas que regresan de los datos de la base de datos. Y mis datos tienen un campo de marca de tiempo, que es diferente en las dos listas de datos. Con la unión obtengo duplicados debido a que la marca de tiempo es diferente. Pero con la combinación puedo decidir qué campo único quiero considerar en el diccionario. +1
JimSan

Puede variar según la velocidad del procesador, depende del tipo de CPU que tenga.
Asad Ali el

77
Y al final del artículo dice: "Prefiero LINQ Union porque comunica la intención muy claramente". ;) (también, solo hubo una diferencia de 8 ms)
James Wilkins

1
Para listas pequeñas donde la diferencia es insignificante, se Unionobtiene un código más limpio y más legible. Pasar tiempo para hiper-optimizar el código cuando no es lento puede incurrir en una penalización de mantenimiento en el futuro.
elolos

14

Utilice la unión de Linq:

using System.Linq;
var l1 = new List<int>() { 1,2,3,4,5 };
var l2 = new List<int>() { 3,5,6,7,8 };
var l3 = l1.Union(l2).ToList();

11
    List<int> first_list = new List<int>() {
        1,
        12,
        12,
        5
    };

    List<int> second_list = new List<int>() {
        12,
        5,
        7,
        9,
        1
    };

    var result = first_list.Union(second_list);
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.