coding: Сравнение 2 словарей с вложенностью без учёта порядка во вложенных списках

суббота, 11 января 2020 г.

Сравнение 2 словарей с вложенностью без учёта порядка во вложенных списках

#python #python_3x

Есть 2 dict'а:

STANDARD_DATA = {
    'applications': [{
        'application': 'CUSTOMER',
        'platforms': [
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform':
'ANDROID'},
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform': 'IOS'}
        ]
    }, {
        'application': 'OWNER',
        'platforms': [
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform':
'ANDROID'},
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform': 'IOS'}
        ]
    }]
}

UPDATED_DATA = {
    'applications': [{
        'application': 'OWNER',
        'platforms': [
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform':
'ANDROID'},
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform': 'IOS'}
        ]
    }, {
        'application': 'CUSTOMER',
        'platforms': [
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform': 'IOS'},
            {'forceUpdate': [], 'latest': '1.19', 'minimal': '1.17', 'platform':
'ANDROID'}
        ]
    }]
}


Т.е. они очень похожи, но данные внутри расположены в разных порядках: OWNER и CUSTOMER
расположены наоборот и внутри CUSTOMER'a ANDROID и IOS поменялись местами.

Вопрос:

Как написать assert при котором эти dict'ы будут равны?

Язык: Python 3.5

Ответы

Ответ 1


Для тестов можно использовать TestCase.assertCountEqual() из стандартной библиотеки,
чтобы сравнить списки без учёта порядка. 

Это не помогает для списков вложенных в dict. Чтобы реализовать сравнение без учёта
порядка для произвольного списка и чтобы получить читаемый diff при вызове assertDictEqual(),
можно определить свой класс, который упорядочивает repr() для списка:

class unordered(list):

    def __repr__(self): # for showing the diff
        return "[%s]" % ", ".join(sorted(map(repr, self)))

    def __eq__(self, other): # for comparison
        return repr(self) == repr(other)


Чтобы заменить возможно глубоко вложенные списки в словаре, можно рекурсивную функцию
использовать:

def make_list_unordered(nested):
    for key, value in getattr(nested, 'items', lambda: enumerate(nested))():
        if isinstance(value, (list, dict)):
            if isinstance(value, list):
                nested[key] = unordered(value)
            make_list_unordered(value)  # transform nested items


При желании можно заменять более широкий класс, используя MutableMapping/MutableSequence
для проверки типов вместо dict/list и использовать явный stack вместо рекурсии.


  Как написать assert при котором эти dict'ы будут равны?


#!/usr/bin/env python3
import unittest

class TestUnordered(unittest.TestCase):

    def test_equal_unordered(self):
        self.assertEqual(unordered('abc'), unordered('bac'))

    @unittest.expectedFailure
    def test_unequal_unordered(self):
        # for the correct error message
        self.addTypeEqualityFunc(unordered, 'assertCountEqual')
        self.assertEqual(unordered('abdc'), unordered('bac'))

    def test_nested_dict(self):
        make_list_unordered(STANDARD_DATA)
        make_list_unordered(UPDATED_DATA)
        self.assertEqual(STANDARD_DATA, UPDATED_DATA)


if __name__ == "__main__":
    unittest.main()


При запуске этого теста выводится:

python test-nested-dict.py 
.Fx
======================================================================
FAIL: test_nested_dict (__main__.TestUnordered)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "test-nested-dict.py", line 37, in test_nested_dict
    self.assertEqual(STANDARD_DATA, UPDATED_DATA)
AssertionError: {'app[184 chars] '1.17', 'platform': 'IOS'}]}, {'application':[179
chars]}]}]} != {'app[184 chars] '1.18', 'platform': 'IOS'}]}, {'application':[179 chars]}]}]}
Diff is 1270 characters long. Set self.maxDiff to None to see it.

----------------------------------------------------------------------
Ran 3 tests in 0.004s

FAILED (failures=1, expected failures=1)


Что ожидаемо, так как '1.17' != '1.18'. Если поправить значение minimal, то тесты
успешно завершаются.


Ответ 2


Долго гугля смог найти подходящее решение, спасибо автору этого гиста
https://gist.github.com/Back2Basics/0e6456de0395fd200a06

import datetime, time, functools, operator, allure

default_fudge = datetime.timedelta(seconds=0, microseconds=0, days=0)


def deep_eq(_v1, _v2, datetime_fudge=default_fudge, _assert=True):
    """
    Tests for deep equality between two python data structures recursing
    into sub-structures if necessary. Works with all python types including
    iterators and generators. This function was dreampt up to test API responses
    but could be used for anything. Be careful. With deeply nested structures
    you may blow the stack.

    Options:
            datetime_fudge => this is a datetime.timedelta object which, when
                              comparing dates, will accept values that differ
                              by the number of seconds specified
            _assert        => passing yes for this will raise an assertion error
                              when values do not match, instead of returning
                              false (very useful in combination with pdb)
    """
    _deep_eq = functools.partial(deep_eq, datetime_fudge=datetime_fudge,
                                 _assert=_assert)

    def _check_assert(R, a, b, reason=''):
        if _assert and not R:
            assert 0, "an assertion has failed in deep_eq (%s) %s != %s" % (
                reason, str(a), str(b))
        return R

    def _deep_dict_eq(d1, d2):
        k1, k2 = (sorted(d1.keys()), sorted(d2.keys()))
        if k1 != k2:  # keys should be exactly equal
            return _check_assert(False, k1, k2, "keys")

        return _check_assert(operator.eq(sum(_deep_eq(d1[k], d2[k])
                                             for k in k1),
                                         len(k1)), d1, d2, "dictionaries")

    def _deep_iter_eq(l1, l2):
        if len(l1) != len(l2):
            return _check_assert(False, l1, l2, "lengths")
        return _check_assert(operator.eq(sum(_deep_eq(v1, v2)
                                             for v1, v2 in zip(l1, l2)),
                                         len(l1)), l1, l2, "iterables")

    def op(a, b):
        _op = operator.eq
        if type(a) == datetime.datetime and type(b) == datetime.datetime:
            s = datetime_fudge.seconds
            t1, t2 = (time.mktime(a.timetuple()), time.mktime(b.timetuple()))
            l = t1 - t2
            l = -l if l > 0 else l
            return _check_assert((-s if s > 0 else s) <= l, a, b, "dates")
        return _check_assert(_op(a, b), a, b, "values")

    c1, c2 = (_v1, _v2)

    # guard against strings because they are iterable and their
    # elements yield iterables infinitely.
    # I N C E P T I O N

    if isinstance(_v1, str):
        pass
    else:
        if isinstance(_v1, dict):
            op = _deep_dict_eq
        else:
            try:
                c1, c2 = (list(iter(_v1)), list(iter(_v2)))
            except TypeError:
                c1, c2 = _v1, _v2
            else:
                op = _deep_iter_eq

    return op(c1, c2)


В результате при включенным _assert=True так же отображаетя в чем проблема:

R = False, a = '1.17', b = '1.19', reason = 'values'

    def _check_assert(R, a, b, reason=''):
        if _assert and not R:
            assert 0, "an assertion has failed in deep_eq (%s) %s != %s" % (
>               reason, str(a), str(b))
E           AssertionError: an assertion has failed in deep_eq (values) 1.17 != 1.19


Ответ 3


def get_data(dt: dict) -> iter:
    apps = dt['applications']
    for e, app in sorted(enumerate(d['application'] for d in apps), key=lambda a: a[1]):
        yield app, sorted(sorted(d.items()) for d in apps[e]['platforms'])

assert list(get_data(STANDARD_DATA)) == list(get_data(UPDATED_DATA))

coding

Страницы

Поиск по вопросам

суббота, 11 января 2020 г.

Сравнение 2 словарей с вложенностью без учёта порядка во вложенных списках

Ответы

Ответ 1

Ответ 2

Ответ 3

Комментариев нет:

Отправить комментарий

Страницы

Поиск по вопросам

суббота, 11 января 2020 г.

Сравнение 2 словарей с вложенностью без учёта порядка во вложенных списках

Ответы

Ответ 1

Ответ 2

Ответ 3

Комментариев нет:

Отправить комментарий

суббота, 11 января 2020 г.