前一章我們講到Where
的使用方式,Where
使用起來很直覺,就像用if else
做判斷一樣,使用一個bool
回傳型態的Lambda Expression
就可以篩選我們所需要的資料,既然Where
使用起來這麼單純,那我們來看看它的原始碼是不是也這麼單純吧。
- Source Code: https://github.com/dotnet/corefx/blob/master/src/System.Linq/src/System/Linq/Where.cs
- Methods:
Where
有兩個Public Methods,我們先來看看其中一個:
public static IEnumerable<TSource> Where<TSource>(this IEnumerable<TSource> source, Func<TSource, int, bool> predicate)
{
if (source == null)
{
throw Error.ArgumentNull(nameof(source));
}
if (predicate == null)
{
throw Error.ArgumentNull(nameof(predicate));
}
return WhereIterator(source, predicate);
}
- 判斷
source
或是predicate
是否為空,如果是空的就拋ArgumentNull
的例外 - 如果都是合法參數則回傳
WhereIterator(source, predicate)
這裡我們依然從委派方法有index
傳入參數的方法看起,可以看到跟前面介紹的LINQ方法在架構上幾乎沒有差別,所以關鍵依然在Iterator
上,我們來看看WhereIterator
的實作:
private static IEnumerable<TSource> WhereIterator<TSource>(IEnumerable<TSource> source, Func<TSource, int, bool> predicate)
{
int index = -1;
foreach (TSource element in source)
{
checked
{
index++;
}
if (predicate(element, index))
{
yield return element;
}
}
}
yield
區塊中的yield return
是傳回每個元素的值,而整個方法的回傳型別是IEnumerable
- 後一個元素會比前個元素多加1
- 用
if
接收predicate
執行後的結果來判斷是否要將目前的元素回傳
Where
這裡毫無意外的用了if
的判斷來決定是否要回傳此元素,整段程式的差別也只有這裡,可見只要學會了Iterator
,大部分的LINQ方法都能夠很快的理解。
接著我們要來看第二個Public Method了,這個是predicate
沒有index
傳入參數的方法:
public static IEnumerable<TSource> Where<TSource>(this IEnumerable<TSource> source, Func<TSource, bool> predicate)
{
#region 判斷傳入參數合法性
if (source == null)
{
throw Error.ArgumentNull(nameof(source));
}
if (predicate == null)
{
throw Error.ArgumentNull(nameof(predicate));
}
#endregion 判斷傳入參數合法性
#region 依據source的型別決定Iterator
if (source is Iterator<TSource> iterator)
{
return iterator.Where(predicate);
}
if (source is TSource[] array)
{
return array.Length == 0 ?
(IEnumerable<TSource>)EmptyPartition<TSource>.Instance :
new WhereArrayIterator<TSource>(array, predicate);
}
if (source is List<TSource> list)
{
return new WhereListIterator<TSource>(list, predicate);
}
return new WhereEnumerableIterator<TSource>(source, predicate);
#endregion 依據source的型別決定Iterator
}
- 判斷傳入參數
source
及predicate
是否為空,空的話回傳ArgumentNull
例外 - 依據
source
的型別決定Iterator
- 已經是
Iterator
的話就直接叫用Iterator
的Where
- 是
Array
的話回傳WhereArrayIterator
- 是
List
的話回傳WhereListIterator
- 只是
IEnumerable
的話就回傳WhereEnumerableIterator
- 已經是
每個Iterator
的處理都大同小異,主要的差別在對於各個型別的處理而已,我們就挑WhereArrayIterator
來說明內部運作吧:
MoveNext()
: 這是整個Iterator
最重要的Method,來看一下Where
是怎麼實作MoveNext()
的
public override bool MoveNext()
{
int index = _state - 1;
TSource[] source = _source;
while (unchecked((uint)index < (uint)source.Length))
{
TSource item = source[index];
index = _state++;
if (_predicate(item))
{
_current = item;
return true;
}
}
Dispose();
return false;
}
_state
為陣列位置的基準,在GetEnumerator()
執行後會被設為1,所以起始的index
是_state - 1
- 巡覽至陣列最尾端,每次都用
predicate
取得是否要回傳元素的判斷 - 通過
predicate
後將current
設為目前的元素,然後回傳true
- 如果巡覽結束則
Dispose()
跟return false
這裡我們可以看到_state
的用法跟前面介紹的SelectMany
是不一樣的,SelectMany
是用來決定是在第幾層的Enumerator
和巡覽結束後要跳回哪層Enumerator
,而Where
則是完全當作index
來使用。
GetCount
: 取得集合的元素數量
public int GetCount(bool onlyIfCheap)
{
if (onlyIfCheap)
{
return -1;
}
int count = 0;
foreach (TSource item in _source)
{
if (_predicate(item))
{
checked
{
count++;
}
}
}
return count;
}
- 如果通過
predicate
的驗證則count
加1
之前我知道了Where
是延遲執行後我就很好奇它的GetCount()
是怎麼運作的,原來還是會全部執行後才取得元素數量。
這個案例的source
是ThrowsOnGetEnumerator()
,會在第一次叫用GetEnumerator()
時丟出InvalidOperationException
例外。
protected class ThrowsOnGetEnumerator : TestEnumerator
{
private int getEnumeratorCallCount;
public override IEnumerator<int> GetEnumerator()
{
if (getEnumeratorCallCount++ == 0)
{
throw new InvalidOperationException();
}
return base.GetEnumerator();
}
}
[Fact]
public void Where_SourceThrowsOnGetEnumerator()
{
IEnumerable<int> source = new ThrowsOnGetEnumerator();
Func<int, bool> truePredicate = (value) => true;
var enumerator = source.Where(truePredicate).GetEnumerator();
// Ensure the first MoveNext call throws an exception
Assert.Throws<InvalidOperationException>(() => enumerator.MoveNext());
// Ensure Current is set to the default value of type T
int currentValue = enumerator.Current;
Assert.Equal(default(int), currentValue);
// Ensure subsequent MoveNext calls succeed
Assert.True(enumerator.MoveNext());
Assert.Equal(1, enumerator.Current);
}
要看懂這個測試案例要建立一個觀念: Where
叫用的GetEnumerator()
並不是source
的GetEnumerator()
,而是Where
自己的GetEnumerator()
。
知道這觀念後我們再看測試案例,這樣也就說得通為什麼不是在var enumerator = source.Where(truePredicate).GetEnumerator();
拋出例外,而是在enumerator.MoveNext()
丟出例外。
由於我們剛剛介紹Where
的MoveNext()
的source
是Array
的,所以他並沒有叫用GetEnumerator()
,現在我們來看看WhereEnumerableIterator
的MoveNext()
:
public override bool MoveNext()
{
switch (_state)
{
case 1:
_enumerator = _source.GetEnumerator();
_state = 2;
goto case 2;
case 2:
while (_enumerator.MoveNext())
{
TSource item = _enumerator.Current;
if (_predicate(item))
{
_current = item;
return true;
}
}
Dispose();
break;
}
return false;
}
這裡才是source.GetEnumerator()
叫用的地方,所以我們第一次叫用source
的GetEnumerator()
是在MoveNext()
而不是在Where
叫用GetEnumerator()
時。
Where語法的主要運作原理在於巡覽時使用predicate
的結果判斷是否將此元素加入結果集合中,簡單的用if
判斷就可以做出如此實用的方法真的是太棒了。