> > -----Original Message-----
> > From: pbhagavat...@marvell.com <pbhagavat...@marvell.com>
> > Sent: Tuesday, May 23, 2023 9:39 AM
> > To: jer...@marvell.com; Honnappa Nagarahalli
> > <honnappa.nagaraha...@arm.com>; nd <n...@arm.com>; Konstantin
> Ananyev
> > <konstantin.v.anan...@yandex.ru>
> > Cc: dev@dpdk.org; Pavan Nikhilesh <pbhagavat...@marvell.com>
> > Subject: [PATCH v2 2/3] ip_frag: improve reassembly lookup performance
> >
> > From: Pavan Nikhilesh <pbhagavat...@marvell.com>
> >
> > Improve reassembly lookup performance by using NEON intrinsics for key
> > validation.
> What is the improvement do you see with this?

On Neoverse-N2 I see around improvement of 300-600c per flow and ~200c per 
insert.

Here are some test results.

Without patch:
+==========================================================================================================+
| IPV4                            | Flow Count : 32768                          
                           |
+================+================+=============+=============+========================+===================+
| Fragment Order | Fragments/Flow | Outstanding | Cycles/Flow | Cycles/Fragment 
insert | Cycles/Reassembly |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 0           | 1244        | 919             
       | 114               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 2              | 0           | 1653        | 968             
       | 128               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 3              | 0           | 1379        | 503             
       | 110               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 3              | 0           | 1613        | 520             
       | 139               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 0           | 2030        | 199             
       | 190               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 8              | 0           | 4393        | 309             
       | 402               |
+================+================+=============+=============+========================+===================+
| LINEAR         | RANDOM         | 0           | 1531        | 333             
       | 147               |
+================+================+=============+=============+========================+===================+
| RANDOM         | RANDOM         | 0           | 2771        | 357             
       | 213               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 100         | 1228        | 920             
       | 102               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 500         | 1197        | 905             
       | 103               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 1000        | 1183        | 904             
       | 104               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 2000        | 1153        | 921             
       | 105               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 3000        | 1123        | 911             
       | 111               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 100         | 829         | 193             
       | 690               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 500         | 830         | 195             
       | 682               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 1000        | 817         | 211             
       | 690               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 2000        | 819         | 195             
       | 690               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 3000        | 823         | 223             
       | 676               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 2              | 0           | 1765        | 1038            
       | 177               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 3              | 0           | 2588        | 699             
       | 190               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 8              | 0           | 5253        | 265             
       | 403               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | RANDOM         | 0           | 3398        | 493             
       | 301               |
+================+================+=============+=============+========================+===================+

+==========================================================================================================+
| IPV6                            | Flow Count : 32768                          
                           |
+================+================+=============+=============+========================+===================+
| Fragment Order | Fragments/Flow | Outstanding | Cycles/Flow | Cycles/Fragment 
insert | Cycles/Reassembly |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 0           | 1838        | 1176            
       | 136               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 2              | 0           | 1892        | 1188            
       | 160               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 3              | 0           | 1986        | 628             
       | 143               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 3              | 0           | 2670        | 646             
       | 155               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 0           | 3152        | 261             
       | 271               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 8              | 0           | 5127        | 324             
       | 434               |
+================+================+=============+=============+========================+===================+
| LINEAR         | RANDOM         | 0           | 2169        | 427             
       | 203               |
+================+================+=============+=============+========================+===================+
| RANDOM         | RANDOM         | 0           | 3382        | 452             
       | 255               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 100         | 1837        | 1164            
       | 124               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 500         | 1790        | 1158            
       | 126               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 1000        | 1807        | 1161            
       | 138               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 2000        | 1776        | 1160            
       | 138               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 3000        | 1715        | 1169            
       | 144               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 100         | 1488        | 256             
       | 1228              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 500         | 1461        | 300             
       | 1205              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 1000        | 1457        | 303             
       | 1202              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 2000        | 1456        | 305             
       | 1201              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 3000        | 1460        | 308             
       | 1205              |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 2              | 0           | 2145        | 1330            
       | 296               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 3              | 0           | 2778        | 830             
       | 330               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 8              | 0           | 5715        | 324             
       | 444               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | RANDOM         | 0           | 3625        | 550             
       | 363               |
+================+================+=============+=============+========================+===================+

With patch :

+==========================================================================================================+
| IPV4                            | Flow Count : 32768                          
                           |
+================+================+=============+=============+========================+===================+
| Fragment Order | Fragments/Flow | Outstanding | Cycles/Flow | Cycles/Fragment 
insert | Cycles/Reassembly |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 0           | 950         | 717             
       | 98                |
+================+================+=============+=============+========================+===================+
| RANDOM         | 2              | 0           | 1013        | 706             
       | 108               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 3              | 0           | 1096        | 397             
       | 115               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 3              | 0           | 1150        | 412             
       | 128               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 0           | 1783        | 166             
       | 202               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 8              | 0           | 3933        | 284             
       | 424               |
+================+================+=============+=============+========================+===================+
| LINEAR         | RANDOM         | 0           | 1288        | 267             
       | 159               |
+================+================+=============+=============+========================+===================+
| RANDOM         | RANDOM         | 0           | 2393        | 302             
       | 235               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 100         | 956         | 703             
       | 110               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 500         | 937         | 693             
       | 112               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 1000        | 912         | 670             
       | 121               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 2000        | 908         | 688             
       | 122               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 3000        | 894         | 688             
       | 128               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 100         | 1019        | 179             
       | 865               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 500         | 1052        | 176             
       | 895               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 1000        | 1130        | 180             
       | 1003              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 2000        | 1143        | 180             
       | 1020              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 3000        | 1130        | 181             
       | 985               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 2              | 0           | 1582        | 710             
       | 168               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 3              | 0           | 2162        | 446             
       | 194               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 8              | 0           | 4997        | 214             
       | 426               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | RANDOM         | 0           | 2921        | 341             
       | 311               |
+================+================+=============+=============+========================+===================+

+==========================================================================================================+
| IPV6                            | Flow Count : 32768                          
                           |
+================+================+=============+=============+========================+===================+
| Fragment Order | Fragments/Flow | Outstanding | Cycles/Flow | Cycles/Fragment 
insert | Cycles/Reassembly |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 0           | 1275        | 687             
       | 125               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 2              | 0           | 1335        | 721             
       | 169               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 3              | 0           | 1388        | 415             
       | 169               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 3              | 0           | 2117        | 393             
       | 163               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 0           | 2811        | 172             
       | 241               |
+================+================+=============+=============+========================+===================+
| RANDOM         | 8              | 0           | 4322        | 227             
       | 401               |
+================+================+=============+=============+========================+===================+
| LINEAR         | RANDOM         | 0           | 1730        | 270             
       | 192               |
+================+================+=============+=============+========================+===================+
| RANDOM         | RANDOM         | 0           | 2839        | 317             
       | 264               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 100         | 1152        | 662             
       | 126               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 500         | 1107        | 658             
       | 130               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 1000        | 1190        | 647             
       | 138               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 2000        | 1086        | 635             
       | 141               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 2              | 3000        | 1064        | 645             
       | 150               |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 100         | 1560        | 172             
       | 1296              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 500         | 1536        | 226             
       | 1274              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 1000        | 1543        | 228             
       | 1282              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 2000        | 1548        | 228             
       | 1287              |
+================+================+=============+=============+========================+===================+
| LINEAR         | 8              | 3000        | 1541        | 227             
       | 1280              |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 2              | 0           | 1585        | 769             
       | 281               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 3              | 0           | 2222        | 536             
       | 327               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | 8              | 0           | 4962        | 232             
       | 439               |
+================+================+=============+=============+========================+===================+
| INTERLEAVED    | RANDOM         | 0           | 2998        | 373             
       | 360               |
+================+================+=============+=============+========================+===================+

> 
> >
> > Signed-off-by: Pavan Nikhilesh <pbhagavat...@marvell.com>
> > ---
> >  lib/ip_frag/ip_frag_internal.c   | 224 +++++++++++++++++++++++++------
> >  lib/ip_frag/ip_reassembly.h      |   6 +
> >  lib/ip_frag/rte_ip_frag_common.c |  10 ++
> >  3 files changed, 196 insertions(+), 44 deletions(-)
> >
> > diff --git a/lib/ip_frag/ip_frag_internal.c b/lib/ip_frag/ip_frag_internal.c
> index
> > 7cbef647df..de78a0ed8f 100644
> > --- a/lib/ip_frag/ip_frag_internal.c
> > +++ b/lib/ip_frag/ip_frag_internal.c
> > @@ -4,8 +4,9 @@
> >
> >  #include <stddef.h>
> >
> > -#include <rte_jhash.h>
> >  #include <rte_hash_crc.h>
> > +#include <rte_jhash.h>
> > +#include <rte_vect.h>
> >
> >  #include "ip_frag_common.h"
> >
> > @@ -280,10 +281,166 @@ ip_frag_find(struct rte_ip_frag_tbl *tbl, struct
> > rte_ip_frag_death_row *dr,
> >     return pkt;
> >  }
> >
> > -struct ip_frag_pkt *
> > -ip_frag_lookup(struct rte_ip_frag_tbl *tbl,
> > -   const struct ip_frag_key *key, uint64_t tms,
> > -   struct ip_frag_pkt **free, struct ip_frag_pkt **stale)
> > +static inline void
> > +ip_frag_dbg(struct rte_ip_frag_tbl *tbl, struct ip_frag_pkt *p,
> > +       uint32_t list_idx, uint32_t list_cnt) {
> > +   RTE_SET_USED(tbl);
> > +   RTE_SET_USED(list_idx);
> > +   RTE_SET_USED(list_cnt);
> > +   if (p->key.key_len == IPV4_KEYLEN)
> > +           IP_FRAG_LOG(DEBUG,
> > +                       "%s:%d:\n"
> > +                       "tbl: %p, max_entries: %u, use_entries: %u\n"
> > +                       "ipv4_frag_pkt line0: %p, index: %u from %u\n"
> > +                       "key: <%" PRIx64 ", %#x>, start: %" PRIu64 "\n",
> > +                       __func__, __LINE__, tbl, tbl->max_entries,
> > +                       tbl->use_entries, p, list_idx, list_cnt,
> > +                       p->key.src_dst[0], p->key.id, p->start);
> > +   else
> > +           IP_FRAG_LOG(DEBUG,
> > +                       "%s:%d:\n"
> > +                       "tbl: %p, max_entries: %u, use_entries: %u\n"
> > +                       "ipv6_frag_pkt line0: %p, index: %u from %u\n"
> > +                       "key: <" IPv6_KEY_BYTES_FMT
> > +                       ", %#x>, start: %" PRIu64 "\n",
> > +                       __func__, __LINE__, tbl, tbl->max_entries,
> > +                       tbl->use_entries, p, list_idx, list_cnt,
> > +                       IPv6_KEY_BYTES(p1[i].key.src_dst), p->key.id,
> > +                       p->start);
> > +}
> > +
> > +#if defined(RTE_ARCH_ARM64)
> > +static inline struct ip_frag_pkt *
> > +ip_frag_lookup_neon(struct rte_ip_frag_tbl *tbl, const struct ip_frag_key
> > *key, uint64_t tms,
> > +               struct ip_frag_pkt **free, struct ip_frag_pkt **stale) {
> > +   struct ip_frag_pkt *empty, *old;
> > +   struct ip_frag_pkt *p1, *p2;
> > +   uint32_t assoc, sig1, sig2;
> > +   uint64_t max_cycles;
> > +
> > +   empty = NULL;
> > +   old = NULL;
> > +
> > +   max_cycles = tbl->max_cycles;
> > +   assoc = tbl->bucket_entries;
> > +
> > +   if (tbl->last != NULL && ip_frag_key_cmp(key, &tbl->last->key) == 0)
> > +           return tbl->last;
> > +
> > +   /* different hashing methods for IPv4 and IPv6 */
> > +   if (key->key_len == IPV4_KEYLEN)
> > +           ipv4_frag_hash(key, &sig1, &sig2);
> > +   else
> > +           ipv6_frag_hash(key, &sig1, &sig2);
> > +
> > +   p1 = IP_FRAG_TBL_POS(tbl, sig1);
> > +   p2 = IP_FRAG_TBL_POS(tbl, sig2);
> > +
> > +   uint64x2_t key0, key1, key2, key3;
> > +   uint64_t vmask, zmask, ts_mask;
> > +   uint64x2_t ts0, ts1;
> > +   uint32x4_t nz_key;
> > +   uint8_t idx;
> > +   /* Bucket entries are always power of 2. */
> > +   rte_prefetch0(&p1[0].key);
> > +   rte_prefetch0(&p1[1].key);
> > +   rte_prefetch0(&p2[0].key);
> > +   rte_prefetch0(&p2[1].key);
> > +
> > +   while (assoc > 1) {
> > +           if (assoc > 2) {
> > +                   rte_prefetch0(&p1[2].key);
> > +                   rte_prefetch0(&p1[3].key);
> > +                   rte_prefetch0(&p2[2].key);
> > +                   rte_prefetch0(&p2[3].key);
> > +           }
> > +           struct ip_frag_pkt *p[] = {&p1[0], &p2[0], &p1[1], &p2[1]};
> > +           key0 = vld1q_u64(&p[0]->key.id_key_len);
> > +           key1 = vld1q_u64(&p[1]->key.id_key_len);
> > +           key2 = vld1q_u64(&p[2]->key.id_key_len);
> > +           key3 = vld1q_u64(&p[3]->key.id_key_len);
> > +
> > +           nz_key =
> > vsetq_lane_u32(vgetq_lane_u32(vreinterpretq_u32_u64(key0), 1),
> nz_key, 0);
> > +           nz_key =
> > vsetq_lane_u32(vgetq_lane_u32(vreinterpretq_u32_u64(key1), 1),
> nz_key, 1);
> > +           nz_key =
> > vsetq_lane_u32(vgetq_lane_u32(vreinterpretq_u32_u64(key2), 1),
> nz_key, 2);
> > +           nz_key =
> > vsetq_lane_u32(vgetq_lane_u32(vreinterpretq_u32_u64(key3),
> > +1), nz_key, 3);
> > +
> > +           nz_key = vceqzq_u32(nz_key);
> > +           zmask =
> > vget_lane_u64(vreinterpret_u64_u16(vshrn_n_u32(nz_key, 16)), 0);
> > +           vmask = ~zmask;
> > +
> > +           vmask &= 0x8000800080008000;
> > +           for (; vmask > 0; vmask &= vmask - 1) {
> > +                   idx = __builtin_ctzll(vmask) >> 4;
> > +                   if (ip_frag_key_cmp(key, &p[idx]->key) == 0)
> > +                           return p[idx];
> > +           }
> > +
> > +           vmask = ~zmask;
> > +           if (zmask && empty == NULL) {
> > +                   zmask &= 0x8000800080008000;
> > +                   idx = __builtin_ctzll(zmask) >> 4;
> > +                   empty = p[idx];
> > +           }
> > +
> > +           if (vmask && old == NULL) {
> > +                   const uint64x2_t max_cyc =
> > vdupq_n_u64(max_cycles);
> > +                   const uint64x2_t cur_cyc = vdupq_n_u64(tms);
> > +
> > +                   ts0 = vsetq_lane_u64(vgetq_lane_u64(key0, 1), ts0,
> > 0);
> > +                   ts0 = vsetq_lane_u64(vgetq_lane_u64(key1, 1), ts0,
> > 1);
> > +                   ts1 = vsetq_lane_u64(vgetq_lane_u64(key2, 1), ts1,
> > 0);
> > +                   ts1 = vsetq_lane_u64(vgetq_lane_u64(key3, 1), ts1,
> > 1);
> > +
> > +                   ts0 = vcgtq_u64(cur_cyc, vaddq_u64(ts0, max_cyc));
> > +                   ts1 = vcgtq_u64(cur_cyc, vaddq_u64(ts1, max_cyc));
> > +
> > +                   ts_mask =
> > vget_lane_u64(vreinterpret_u64_u16(vshrn_n_u32(
> > +
> >     vuzp1q_u32(vreinterpretq_u32_u64(ts0),
> > +
> > vreinterpretq_u32_u64(ts1)),
> > +                                                   16)),
> > +                                           0);
> > +                   vmask &= 0x8000800080008000;
> > +                   ts_mask &= vmask;
> > +                   if (ts_mask) {
> > +                           idx = __builtin_ctzll(ts_mask) >> 4;
> > +                           old = p[idx];
> > +                   }
> > +           }
> > +           p1 += 2;
> > +           p2 += 2;
> > +           assoc -= 4;
> > +   }
> > +   while (assoc) {
> > +           if (ip_frag_key_cmp(key, &p1->key) == 0)
> > +                   return p1;
> > +           else if (ip_frag_key_is_empty(&p1->key))
> > +                   empty = (empty == NULL) ? p1 : empty;
> > +           else if (max_cycles + p1->start < tms)
> > +                   old = (old == NULL) ? p1 : old;
> > +
> > +           if (ip_frag_key_cmp(key, &p2->key) == 0)
> > +                   return p2;
> > +           else if (ip_frag_key_is_empty(&p2->key))
> > +                   empty = (empty == NULL) ? p2 : empty;
> > +           else if (max_cycles + p2->start < tms)
> > +                   old = (old == NULL) ? p2 : old;
> > +           p1++;
> > +           p2++;
> > +           assoc--;
> > +   }
> > +
> > +   *free = empty;
> > +   *stale = old;
> > +   return NULL;
> > +}
> > +#endif
> > +
> > +static struct ip_frag_pkt *
> > +ip_frag_lookup_scalar(struct rte_ip_frag_tbl *tbl, const struct
> ip_frag_key
> > *key, uint64_t tms,
> > +                 struct ip_frag_pkt **free, struct ip_frag_pkt **stale)
> >  {
> >     struct ip_frag_pkt *p1, *p2;
> >     struct ip_frag_pkt *empty, *old;
> > @@ -309,25 +466,7 @@ ip_frag_lookup(struct rte_ip_frag_tbl *tbl,
> >     p2 = IP_FRAG_TBL_POS(tbl, sig2);
> >
> >     for (i = 0; i != assoc; i++) {
> > -           if (p1->key.key_len == IPV4_KEYLEN)
> > -                   IP_FRAG_LOG(DEBUG, "%s:%d:\n"
> > -                                   "tbl: %p, max_entries: %u,
> > use_entries: %u\n"
> > -                                   "ipv4_frag_pkt line0: %p, index: %u
> > from %u\n"
> > -                   "key: <%" PRIx64 ", %#x>, start: %" PRIu64 "\n",
> > -                                   __func__, __LINE__,
> > -                                   tbl, tbl->max_entries, tbl-
> >use_entries,
> > -                                   p1, i, assoc,
> > -                   p1[i].key.src_dst[0], p1[i].key.id, p1[i].start);
> > -           else
> > -                   IP_FRAG_LOG(DEBUG, "%s:%d:\n"
> > -                                   "tbl: %p, max_entries: %u,
> > use_entries: %u\n"
> > -                                   "ipv6_frag_pkt line0: %p, index: %u
> > from %u\n"
> > -                   "key: <" IPv6_KEY_BYTES_FMT ", %#x>, start: %"
> > PRIu64 "\n",
> > -                                   __func__, __LINE__,
> > -                                   tbl, tbl->max_entries, tbl-
> >use_entries,
> > -                                   p1, i, assoc,
> > -                   IPv6_KEY_BYTES(p1[i].key.src_dst), p1[i].key.id,
> > p1[i].start);
> > -
> > +           ip_frag_dbg(tbl, &p1[i], i, assoc);
> >             if (ip_frag_key_cmp(key, &p1[i].key) == 0)
> >                     return p1 + i;
> >             else if (ip_frag_key_is_empty(&p1[i].key))
> > @@ -335,29 +474,11 @@ ip_frag_lookup(struct rte_ip_frag_tbl *tbl,
> >             else if (max_cycles + p1[i].start < tms)
> >                     old = (old == NULL) ? (p1 + i) : old;
> >
> > -           if (p2->key.key_len == IPV4_KEYLEN)
> > -                   IP_FRAG_LOG(DEBUG, "%s:%d:\n"
> > -                                   "tbl: %p, max_entries: %u,
> > use_entries: %u\n"
> > -                                   "ipv4_frag_pkt line1: %p, index: %u
> > from %u\n"
> > -                   "key: <%" PRIx64 ", %#x>, start: %" PRIu64 "\n",
> > -                                   __func__, __LINE__,
> > -                                   tbl, tbl->max_entries, tbl-
> >use_entries,
> > -                                   p2, i, assoc,
> > -                   p2[i].key.src_dst[0], p2[i].key.id, p2[i].start);
> > -           else
> > -                   IP_FRAG_LOG(DEBUG, "%s:%d:\n"
> > -                                   "tbl: %p, max_entries: %u,
> > use_entries: %u\n"
> > -                                   "ipv6_frag_pkt line1: %p, index: %u
> > from %u\n"
> > -                   "key: <" IPv6_KEY_BYTES_FMT ", %#x>, start: %"
> > PRIu64 "\n",
> > -                                   __func__, __LINE__,
> > -                                   tbl, tbl->max_entries, tbl-
> >use_entries,
> > -                                   p2, i, assoc,
> > -                   IPv6_KEY_BYTES(p2[i].key.src_dst), p2[i].key.id,
> > p2[i].start);
> > -
> > +           ip_frag_dbg(tbl, &p2[i], i, assoc);
> >             if (ip_frag_key_cmp(key, &p2[i].key) == 0)
> >                     return p2 + i;
> >             else if (ip_frag_key_is_empty(&p2[i].key))
> > -                   empty = (empty == NULL) ?( p2 + i) : empty;
> > +                   empty = (empty == NULL) ? (p2 + i) : empty;
> >             else if (max_cycles + p2[i].start < tms)
> >                     old = (old == NULL) ? (p2 + i) : old;
> >     }
> > @@ -366,3 +487,18 @@ ip_frag_lookup(struct rte_ip_frag_tbl *tbl,
> >     *stale = old;
> >     return NULL;
> >  }
> > +
> > +struct ip_frag_pkt *
> > +ip_frag_lookup(struct rte_ip_frag_tbl *tbl, const struct ip_frag_key *key,
> > uint64_t tms,
> > +          struct ip_frag_pkt **free, struct ip_frag_pkt **stale) {
> > +   switch (tbl->lookup_fn) {
> > +#if defined(RTE_ARCH_ARM64)
> > +   case REASSEMBLY_LOOKUP_NEON:
> > +           return ip_frag_lookup_neon(tbl, key, tms, free, stale);
> #endif
> > +   case REASSEMBLY_LOOKUP_SCALAR:
> > +   default:
> > +           return ip_frag_lookup_scalar(tbl, key, tms, free, stale);
> > +   }
> > +}
> > diff --git a/lib/ip_frag/ip_reassembly.h b/lib/ip_frag/ip_reassembly.h index
> > ef9d8c0d75..049437ae32 100644
> > --- a/lib/ip_frag/ip_reassembly.h
> > +++ b/lib/ip_frag/ip_reassembly.h
> > @@ -12,6 +12,11 @@
> >
> >  #include <rte_ip_frag.h>
> >
> > +enum ip_frag_lookup_func {
> > +   REASSEMBLY_LOOKUP_SCALAR = 0,
> > +   REASSEMBLY_LOOKUP_NEON,
> > +};
> > +
> >  enum {
> >     IP_LAST_FRAG_IDX,    /* index of last fragment */
> >     IP_FIRST_FRAG_IDX,   /* index of first fragment */
> > @@ -83,6 +88,7 @@ struct rte_ip_frag_tbl {
> >     struct ip_frag_pkt *last;     /* last used entry. */
> >     struct ip_pkt_list lru;       /* LRU list for table entries. */
> >     struct ip_frag_tbl_stat stat; /* statistics counters. */
> > +   enum ip_frag_lookup_func lookup_fn;     /* hash table lookup
> function.
> > */
> >     __extension__ struct ip_frag_pkt pkt[]; /* hash table. */  };
> >
> > diff --git a/lib/ip_frag/rte_ip_frag_common.c
> > b/lib/ip_frag/rte_ip_frag_common.c
> > index c1de2e81b6..ef3c104e45 100644
> > --- a/lib/ip_frag/rte_ip_frag_common.c
> > +++ b/lib/ip_frag/rte_ip_frag_common.c
> > @@ -5,7 +5,9 @@
> >  #include <stddef.h>
> >  #include <stdio.h>
> >
> > +#include <rte_cpuflags.h>
> >  #include <rte_log.h>
> > +#include <rte_vect.h>
> >
> >  #include "ip_frag_common.h"
> >
> > @@ -75,6 +77,14 @@ rte_ip_frag_table_create(uint32_t bucket_num,
> > uint32_t bucket_entries,
> >     tbl->bucket_entries = bucket_entries;
> >     tbl->entry_mask = (tbl->nb_entries - 1) & ~(tbl->bucket_entries  - 1);
> >
> > +#if defined(RTE_ARCH_ARM64)
> > +   if (rte_cpu_get_flag_enabled(RTE_CPUFLAG_NEON) &&
> > +       rte_vect_get_max_simd_bitwidth() >= RTE_VECT_SIMD_128)
> > +           tbl->lookup_fn = REASSEMBLY_LOOKUP_NEON;
> > +   else
> > +#endif
> > +           tbl->lookup_fn = REASSEMBLY_LOOKUP_SCALAR;
> > +
> >     TAILQ_INIT(&(tbl->lru));
> >     return tbl;
> >  }
> > --
> > 2.25.1

Reply via email to