您好,登錄后才能下訂單哦!
今天小編給大家分享一下PHP排序穩定性實例分析的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。
最近在工作中碰到一個挺有意思的問題,線上輸入是一串排好序的關聯數組,經過一系列處理后輸出的數組卻是亂序,且本地運行無法復現。查看相關代碼后,最讓人在意的是這一段:
$categories = Arr::sort($categories, function ($node) { return $node['default']; }, true);
作用是按default
優先級將元素提到前面,首先確認了下線上的illuminate/support
版本和本地一致,查看Arr::sort()
源碼:
... $descending ? arsort($results, $options) : asort($results, $options);
最終還是調用 php 的asort
,線上是 php5 而本地和測試因為最近考慮升級都換成了 php7,最后在 php5 環境下成功復現,確定出是sort
問題。
在排序前后相等的元素相對位置不變即說這個算法是穩定的。
對快速排序有一定了解的話可以知道,快速排序是不穩定的所以這段代碼在元素default
優先級都相同的情況下輸出將不會是之前的順序,但在 php7 環境下測試結果為什么會保留原來的順序呢。難道關于我之前理解的天底下所有默認排序都是快速排序這一點是錯的嗎?
好吧,讓我們來快速看看 php 源碼是如何解決這個問題的。到 github 官方的 php-src 直接搜索asort
in this repository,找c文件,找到這個函數定義在 arr.c:814
PHP_FUNCTION(asort) { zval *array; zend_long sort_type = PHP_SORT_REGULAR; bucket_compare_func_t cmp; ZEND_PARSE_PARAMETERS_START(1, 2) Z_PARAM_ARRAY_EX(array, 0, 1) Z_PARAM_OPTIONAL Z_PARAM_LONG(sort_type) ZEND_PARSE_PARAMETERS_END(); // 設置比較函數 cmp = php_get_data_compare_func(sort_type, 0); zend_hash_sort(Z_ARRVAL_P(array), cmp, 0); RETURN_TRUE; }
可以看到最終調用的是zend_hash_sort()
,我們繼續搜索:
發現這個函數是zend_hash_sort_ex()
的套娃,最后找到zend_hash.c:2497
ZEND_API void ZEND_FASTCALL zend_hash_sort_ex(HashTable *ht, sort_func_t sort, bucket_compare_func_t compar, zend_bool renumber) { Bucket *p; uint32_t i, j; IS_CONSISTENT(ht); HT_ASSERT_RC1(ht); if (!(ht->nNumOfElements>1) && !(renumber && ht->nNumOfElements>0)) { /* Doesn't require sorting */ return; } // 這里的hole指數組元素被unset掉產生的洞 if (HT_IS_WITHOUT_HOLES(ht)) { /* Store original order of elements in extra space to allow stable sorting. */ for (i = 0; i < ht->nNumUsed; i++) { Z_EXTRA(ht->arData[i].val) = i; } } else { /* Remove holes and store original order. */ for (j = 0, i = 0; j < ht->nNumUsed; j++) { p = ht->arData + j; if (UNEXPECTED(Z_TYPE(p->val) == IS_UNDEF)) continue; if (i != j) { ht->arData[i] = *p; } Z_EXTRA(ht->arData[i].val) = i; i++; } ht->nNumUsed = i; } sort((void *)ht->arData, ht->nNumUsed, sizeof(Bucket), (compare_func_t) compar, (swap_func_t)(renumber? zend_hash_bucket_renum_swap : ((HT_FLAGS(ht) & HASH_FLAG_PACKED) ? zend_hash_bucket_packed_swap : zend_hash_bucket_swap))); ...
好耶!,官方注釋里就有說明是怎么實現排序的穩定性,在排序之前用這個Z_EXTRA
保留了原數組元素到下標的映射。
但當我搜索這塊代碼提交信息時發現了一個問題:穩定排序相關的 rfc 在https://wiki.php.net/rfc/stable_sorting,可以看到是發生在今年五月份且針對 php8.0 的。
?? 那之前的 php7 排序穩定是怎么回事。
馬上構造個例子:
$count = 10; $cc = []; for ($i=0; $i<$count; $i++) { $cc[] = [ 'id' => $i, 'default' => rand(0, 10), ]; } $cc = Arr::sort($cc, function ($i) { return $i['default']; }); dd($cc);
經過多次在 php7 下的測試發現:當$count
比較小的時候,排序才是穩定的,但$count
較大情況下的排序又變成不穩定。也就是線上排序不穩定而本地無法復現其實是用例的數組長度太短所致。
看到這里可以確定是快速排序長度閾值優化的問題,最后查了下相關資料。php7 中的sort
是基于LLVM
中libc++
的std::sort
實現。當元素數量小于等于16時候有特殊優化,大于16才走快速排序,而 php5 是直接就走快速排序的。
<?php $count = 100; $cc = []; for ($i=0; $i<$count; $i++) { $cc[] = [ 'id' => $i, 'default' => rand(0, 10), ]; } usort($cc, function($a, $b){ if ($a['default'] == $b['default']) return 0; return ($a['default'] < $b['default']) ? 1 : -1; }); print_r($cc);
最后在 php8 環境下試了試,排序絕對穩定
以上就是“PHP排序穩定性實例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。