]> git.dujemihanovic.xyz Git - linux.git/commit
net/mlx5: Fix error path in multi-packet WQE transmit
authorGerd Bayer <gbayer@linux.ibm.com>
Tue, 10 Sep 2024 08:53:51 +0000 (10:53 +0200)
committerSaeed Mahameed <saeedm@nvidia.com>
Wed, 25 Sep 2024 20:15:44 +0000 (13:15 -0700)
commit2bcae12c795f32ddfbf8c80d1b5f1d3286341c32
tree33296397916350875dc746390ad911a8612e5738
parent0cbfd45fbcf0cb26d85c981b91c62fe73cdee01c
net/mlx5: Fix error path in multi-packet WQE transmit

Remove the erroneous unmap in case no DMA mapping was established

The multi-packet WQE transmit code attempts to obtain a DMA mapping for
the skb. This could fail, e.g. under memory pressure, when the IOMMU
driver just can't allocate more memory for page tables. While the code
tries to handle this in the path below the err_unmap label it erroneously
unmaps one entry from the sq's FIFO list of active mappings. Since the
current map attempt failed this unmap is removing some random DMA mapping
that might still be required. If the PCI function now presents that IOVA,
the IOMMU may assumes a rogue DMA access and e.g. on s390 puts the PCI
function in error state.

The erroneous behavior was seen in a stress-test environment that created
memory pressure.

Fixes: 5af75c747e2a ("net/mlx5e: Enhanced TX MPWQE for SKBs")
Signed-off-by: Gerd Bayer <gbayer@linux.ibm.com>
Reviewed-by: Zhu Yanjun <yanjun.zhu@linux.dev>
Acked-by: Maxim Mikityanskiy <maxtram95@gmail.com>
Signed-off-by: Saeed Mahameed <saeedm@nvidia.com>
drivers/net/ethernet/mellanox/mlx5/core/en_tx.c