MVP programu Excel rozwiązują problem czyszczenia danych w dodatku Power Query - porady dotyczące programu Excel

Spisie treści

Uwaga

Jest to jeden z serii artykułów opisujących szczegółowo rozwiązania przesłane w ramach wyzwania Podcast 2316.

Excel MVP Oz Du Soleil z kanału Excel on Fire na YouTube wspomniał o brazylijskim jeźdźcu byków Kaique Pachecho. Oz był pierwszą osobą, która zauważyła, że ​​poszedłem powoli, dodając cztery ćwiartki.

Film Oz:
https://www.youtube.com/watch?v=OluZlF44PNI

Jego kod to:

let Source = Excel.CurrentWorkbook()((Name="UglyData"))(Content), #"Removed Columns" = Table.RemoveColumns(Source,("Column2", "Column3", "Column4", "Column5", "Column6")), #"Transposed Table" = Table.Transpose(#"Removed Columns"), #"Promoted Headers" = Table.PromoteHeaders(#"Transposed Table", (PromoteAllScalars=true)), #"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",(("Category Description", type text), ("Administrative", type number), ("Holiday", Int64.Type), ("PTO/LOA/Jury Duty", Int64.Type), ("Project A", type number), ("Project B", type number), ("Project C", type number))), #"Added Conditional Column" = Table.AddColumn(#"Changed Type", "Custom", each if (Category Description) = "Q1" then null else if (Category Description) = "Q2" then null else if (Category Description) = "Q3" then null else if (Category Description) = "Q4" then null else (Category Description)), #"Filled Down" = Table.FillDown(#"Added Conditional Column",("Custom")), #"Renamed Columns" = Table.RenameColumns(#"Filled Down",(("Custom", "Names"))), #"Filtered Rows" = Table.SelectRows(#"Renamed Columns", each (Category Description) = "Q1" or (Category Description) = "Q2" or (Category Description) = "Q3" or (Category Description) = "Q4"), #"Reordered Columns" = Table.ReorderColumns(#"Filtered Rows",("Names", "Category Description", "Administrative", "Holiday", "PTO/LOA/Jury Duty", "Project A", "Project B", "Project C")), #"Unpivoted Other Columns" = Table.UnpivotOtherColumns(#"Reordered Columns", ("Names", "Category Description"), "Attribute", "Value"), #"Pivoted Column" = Table.Pivot(#"Unpivoted Other Columns", List.Distinct(#"Unpivoted Other Columns"(#"Category Description")), "Category Description", "Value", List.Sum), #"Inserted Sum" = Table.AddColumn(#"Pivoted Column", "Addition", each List.Sum(((Q1), (Q2), (Q3), (Q4))), type number), #"Renamed Columns1" = Table.RenameColumns(#"Inserted Sum",(("Addition", "TOTAL"))) in #"Renamed Columns1"

Inne rozwiązanie, to od Excela MVP Johna MacDougalla.

  • Jan jako pierwszy powiedział, że usuwając dwa dodatkowe kroki dodane przez Power Query, eliminujesz nieparzyste sufiksy ze zduplikowanych nagłówków Q1 Q2 Q3 Q4.
  • John wcześnie użył kolumny indeksu, która zostanie użyta na końcu do sortowania. Ale - John konkatenował swoją kolumnę indeksu po opisie kategorii. Użył pionowej kreski | aby mógł później ujawnić dane.
  • John wpisał swoją kolumnę warunkową jako kolumnę niestandardową zamiast korzystać z interfejsu kolumny warunkowej.
Kolumna warunkowa jako kolumna niestandardowa

Obejrzyj wideo Johna tutaj:
https://www.youtube.com/watch?v=Dqmb6SEJDXI

Excel MVP Ken Puls, współautor książki M is for (Data) Monkey, przesłanej w trzech rozwiązaniach. Jego kolumna warunkowa jest prawdopodobnie najkrótsza.

Ale preferowane rozwiązanie Kena ignoruje pierwotne pytanie. Zamiast tworzyć tabelę w dodatku Power Query, tworzy przestawny zestaw danych w dodatku Power Query, a następnie kończy pracę z tabelą przestawną.

Ostateczny podgląd Kena w dodatku Power Query wygląda następująco:

Obrotowy zestaw danych

Oto kod Kena:

let Source = Excel.CurrentWorkbook()((Name="UglyData"))(Content), #"Promoted Headers" = Table.PromoteHeaders(Source, (PromoteAllScalars=true)), #"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",(("Category Description", type text), ("Dept. Total", type number), ("Q1", type number), ("Q2", type number), ("Q3", type number), ("Q4", Int64.Type), ("Employee 1", type number), ("Q1_1", type number), ("Q2_2", type number), ("Q3_3", Int64.Type), ("Q4_4", Int64.Type), ("Employee 2", Int64.Type), ("Q1_5", Int64.Type), ("Q2_6", Int64.Type), ("Q3_7", Int64.Type), ("Q4_8", Int64.Type), ("Employee 3", Int64.Type), ("Q1_9", Int64.Type), ("Q2_10", Int64.Type), ("Q3_11", Int64.Type), ("Q4_12", Int64.Type), ("Employee 4", type number), ("Q1_13", type number), ("Q2_14", type number), ("Q3_15", type number), ("Q4_16", Int64.Type))), #"Removed Columns" = Table.RemoveColumns(#"Changed Type",("Dept. Total", "Q1", "Q2", "Q3", "Q4")), #"Unpivoted Other Columns" = Table.UnpivotOtherColumns(#"Removed Columns", ("Category Description"), "Attribute", "Value"), #"Added Conditional Column" = Table.AddColumn(#"Unpivoted Other Columns", "Employee", each if Text.Contains((Attribute), "_") then null else (Attribute)), #"Filled Down" = Table.FillDown(#"Added Conditional Column",("Employee")), #"Split Column by Delimiter" = Table.SplitColumn(#"Filled Down", "Attribute", Splitter.SplitTextByEachDelimiter(("_"), QuoteStyle.Csv, false), ("Attribute.1", "Attribute.2")), #"Changed Type1" = Table.TransformColumnTypes(#"Split Column by Delimiter",(("Attribute.1", type text), ("Attribute.2", Int64.Type))), #"Filtered Rows" = Table.SelectRows(#"Changed Type1", each ((Attribute.2) null)), #"Removed Columns1" = Table.RemoveColumns(#"Filtered Rows",("Attribute.2")), #"Renamed Columns" = Table.RenameColumns(#"Removed Columns1",(("Attribute.1", "Quarter"), ("Value", "Amount"))), #"Changed Type2" = Table.TransformColumnTypes(#"Renamed Columns",(("Category Description", type text), ("Quarter", type text), ("Amount", type number), ("Employee", type text))) in #"Changed Type2"

Po utworzeniu tego zapytania tylko jako połączenia, używa tabeli przestawnej do utworzenia raportu końcowego.

Raport końcowy z tabelą przestawną

Rozwiązania innych MVP:

  • Kod Wyna Hopkinsa jest tutaj: Power Query: Radzenie sobie z wieloma identycznymi nagłówkami.
  • Kod Mike'a Girvina jest tutaj: Power Query: Wyodrębnianie 2 lewych znaków z kolumny.
  • Rozwiązanie formuły Rogera Goviera jest tutaj: Formula Solutions.

Wróć do strony głównej wyzwania Podcast 2316.

Przeczytaj następny artykuł z tej serii: Power Query: Beyond the User Interface: Table.Split and more.

Interesujące artykuły...