check in
[Ultimately_Untrue_Thought.git] / content / drafts / challenges-to-yudkowskys-pronoun-reform-proposal.md
diff --git a/content/drafts/challenges-to-yudkowskys-pronoun-reform-proposal.md b/content/drafts/challenges-to-yudkowskys-pronoun-reform-proposal.md
deleted file mode 100644 (file)
index 448296a..0000000
+++ /dev/null
@@ -1,562 +0,0 @@
-Title: Challenges to Yudkowsky's Pronoun Reform Proposal
-Date: 2022-01-01 11:00
-Category: commentary
-Tags: Eliezer Yudkowsky, convention
-Status: draft
-
-> Go, Soul, the body's guest,  
-> Upon a thankless errand:  
-> Fear not to touch the best;  
-> The truth shall be thy warrant:  
-> Go, since I needs must die,  
-> And give the world the lie.
->
-> —["The Lie" by Walter Raleigh](https://www.lesswrong.com/posts/trb9HPWFk8Gy9MBdN/less-wrong-poetry-corner-walter-raleigh-s-the-lie)
-
-### Summary of Claims
-
- * In a February 2021 Facebook post, Eliezer Yudkowsky inveighs against English's system of singular third-person pronouns: as a matter of clean language design, English's lack of a gender-neutral singular third-person pronoun is a serious flaw: you shouldn't be required to commit to a stance on what sex someone is in order to say a grammatical sentence about her or him.
-
- * This seems fine as a critique of the existing English language. However, Yudkowsky then goes on to proclaim, in connection with pronouns for transgender people, that "the simplest and best protocol is, '"He" refers to the set of people who have asked us to use "he", with a default for those-who-haven't-asked that goes by gamete size' and to say that this just _is_ the normative definition. Because it is _logically_ rude, not just socially rude, to try to bake any other more complicated and controversial definition _into the very language protocol we are using to communicate_."
-
- * However, this allegedly "simplest and best" proposal fails to achieve its stated aim of avoiding baking controversial claims into the language grammar. **The _reason_ trans people want others to use their designated pronouns is _because_ they're trying to control their socially-perceived sex category** and English speakers interpret _she_ and _he_ as conveying sex-category information. The circular redefinition is functionally "hypocritical": **if it were _actually true_ that _he_ simply referred to those who take the pronoun _he_, then there would be no reason for trans people to care which pronoun people used for them.**
-
- * **The "meaning" of language isn't some epiphenominal extraphysical fact that can be declared or ascertained separately from common usage.** The word "dog" means what it does _because_ English speakers use the word that way; if you wanted "dog" to mean something different, you'd need to change the way English speakers behave. Thus, **circularly redefining _he_ and _she_ as purportedly referring to pronoun preferences rather than sex doesn't work, if people are still in practice choosing pronouns on the basis of perceived sex.**
-
- * **Given that _she_ and _he_ do in fact convey sex category information to English speakers, some speakers might perceive an interest in resisting pressure to use pronouns in a way that contradicts their perception of what sex people are.** This does _not_ constitute a philosophical committment that pronouns can be "lies" as such.
-
- * In the comments of the Facebook post, Yudkowsky seemingly denies that pronouns convey sex category information to native English speakers, claiming, "I do not know what it feels like from the inside to feel like a pronoun is attached to something in your head much more firmly than 'doesn't look like an Oliver' is attached to something in your head." **This self-report is not plausible, as evidenced by previous writings by Yudkowsky that treat sex and pronouns as synonymous.**
-
- * **I'm _not_ claiming that Yudkowsky should have a different pronoun usage policy.** I agree that misgendering all trans people "on principle" seems very wrong and unappealing. Rather, I'm claiming that [**policy debates should not appear one-sided**](https://www.lesswrong.com/posts/PeSzc9JTBxhaYRp9b/policy-debates-should-not-appear-one-sided); in order to be politically neutral in your analysis of why someone might choose one pronoun policy over another, you need to _acknowledge_ the costs and benefits of a policy to different parties. **It can simultaneously be the case that pressuring speakers to use pronouns at odds with their perceptions of sex is a cost to those speakers, _and_ that not exerting such pressure is a cost to trans people.** It's possible and desirable to be honest about that cost–benefit analysis, while ultimately choosing a policy that favors some parties' interests over others.
-
- * If I don't disagree with the ultimate policy decision of "don't misgender trans people", why am I putting so much effort in disputing Yudkowsky's reasoning in support of that policy? In addition to ["arguments matter, not conclusions" being a general principle of correct cognition](https://www.lesswrong.com/posts/34XxbRFe54FycoCDw/the-bottom-line), it's because in this case, **I need the correct reasoning in order to make extremely impactful social and medical decisions.** People with gender dysphoria who are considering whether to transition need _factually accurate information_ about gender-transition interventions: if you have the facts wrong, you might wrongly avoid an intervention that would have benefitted you, or wrongly undergo an intevention that harms you. If it were _actually true_ that the simplest and best convention is that _he_ refers to the set of people who have asked us to use _he_, then asking for new pronouns despite not physically passing as the corresponding sex wouldn't be costly, but in fact, it is costly. Thus, **Yudkowsky is harming a reference class of people that includes me by spreading disinformation about the costs of asking for new pronouns; I'm better off because I don't trust Eliezer Yudkowsky to tell the truth.**
-
- * [TODO: summarize coda]
-
-<p class="flower-break">⁕ ⁕ ⁕</p>
-
-[In a February 2021 Facebook post, Eliezer Yudkowsky inveighs against English's system of singular third-person pronouns](https://www.facebook.com/yudkowsky/posts/10159421750419228). As a matter of clean language design, English's lack of a gender-neutral singular third-person pronoun is a serious flaw. The function of pronouns is to have a brief way to refer back to entities already mentioned: it's more concise to be able to say "Katherine put her book on its shelf" rather than "Katherine put Katherine's book on the book's shelf". But then why couple that grammatical function to sex-category membership? You shouldn't _need_ to take a stance on someone's sex in order to talk about [her or](/2020/Apr/the-reverse-murray-rule/) him putting a book on the shelf.
-
-This affects, for example, science-fiction authors writing about AIs or hermaphroditic aliens (which don't have a sex), or mystery authors writing about a crime suspect whose identity (and therefore, sex) is unknown. In these cases, _she_ or _he_ are inappropriate, but the English language offers no alternative lacking its own downsides: _it_ is understood to refer to non-persons, _they_ gets conjugated as a plural, and neopronouns like [_ey/em/eir_](https://en.wikipedia.org/wiki/Spivak_pronoun)—or [_ve/ver/vis_](http://www.urticator.net/essay/0/30.html), as used in some of [Yudkowsky's juvenilia](https://intelligence.org/files/CFAI.pdf)—are hard to rally adoption for because pronouns are a [closed class](https://en.wikipedia.org/wiki/Part_of_speech#Open_and_closed_classes)—not something people are used to new members of being coined, in the way that people are used to seeing unfamiliar nouns and adjectives.
-
-It doesn't have to be this way! If you were fortunate enough to be in the position of intelligently designing a language from scratch, you could just include a singular third-person gender-neutral pronoun (like _it_, but for persons, or like _they_ but unambiguously singular) in the original closed set of pronouns! If you wanted more pronoun-classes to reduce the probability of collisions (where universal [_ey_](https://en.wikipedia.org/wiki/Spivak_pronoun) or singular _they_ would result in more frequent need to repeat names where a pronoun would be ambiguous), you could devise some other system that doesn't bake sex into the language while driving the collision rate even lower than that of the sex-based system—like using initials to form pronouns (<em>K</em>atherine put <em>k</em>er book on its shelf?), or an oral or written analogue of [spatial referencing in American Sign Language](https://www.handspeak.com/learn/index.php?id=27) (where a signer associates a name or description with a direction in space, and points in that direction for subsequent references).
-
-(Although—one might speculate that "more classes to reduce collisions" could _be_ part of the historical explanation for grammatical gender, in conjunction with the fact that sex is binary and easy to observe. None of the other most salient features of a human can quite accomplish the same job: age is continuous rather than categorical; race is also largely continuous [(clinal)](https://en.wikipedia.org/wiki/Cline_(biology)) and historically didn't typically vary within a tribal/community context.)
-
-If you grew up speaking English, gendered pronouns feel "normal" while gendered [noun classes](https://en.wikipedia.org/wiki/Noun_class) in many other languages (where, _e.g._, in French, a dog, _le chien_, is "masculine", but potatoes, _la pommes de terre_, are "feminine") seem strange and unnecessary, but someone who grew up with neither would regard both as strange. If you spoke a language that didn't _already_ have gendered pronouns, you probably wouldn't be spontaneously eager to add them.
-
-All this seems fine as a critique of the existing English pronoun system! However, I argue that Yudkowsky's prescriptions for English speakers going forward goes badly wrong. First, Yudkowsky argues that it's bad for stances on complicated empirical issues to be baked into the language grammar itself: since people might disagree on who fits into the [empirical clusters](https://www.lesswrong.com/posts/WBw8dDkAWohFjWQSk/the-cluster-structure-of-thingspace) of "female" and "male", you don't want people to be forced to make a call on that just in order to be able to use a pronoun.
-
-Fair enough. Sounds like an argument for universal singular _they_ (and eating the cost of increased collisions where it's ambiguous which subject an instance of _they_ would refer to): if you don't think pronouns should convey sex-category information, then don't use pronouns that convey sex-category information! But then, in an unexplained leap, Yudkowsky proclaims:
-
-> So it seems to me that the simplest and best protocol is, "'He' refers to the set of people who have asked us to use 'he', with a default for those-who-haven't-asked that goes by gamete size" and to say that this just _is_ the normative definition. Because it is _logically_ rude, not just socially rude, to try to bake any other more complicated and controversial definition _into the very language protocol we are using to communicate_.
-
-The problem with this is that [the alleged rationale for the proposal does not support the proposal](https://www.lesswrong.com/posts/i6fKszWY6gLZSX2Ey/fake-optimization-criteria). If your default pronoun for those-who-haven't-asked goes by perceived sex (which one presumes is what Yudkowsky means by "gamete size"—we almost never _observe_ people's gametes), then you're still baking sex-category information into the language protocol in the form of the default! Moreover, this is clearly an "intended" rather than an accidental effect of the proposal, in the sense that a policy that _actually_ avoided baking sex-category information into the language (like universal singular _they_, or name-initial- or hair-color-based pronouns) would not have the same appeal to many of those who support self-chosen pronouns: _why_ is it that some people would want to opt-out of the sex-based default?
-
-Well, it would seem that the motivating example—the causal–historical explanation for why we're having this conversation about pronoun reform in the first place—is that trans men (female-to-male transsexuals) prefer to be called _he_, and trans women (male-to-female transsexuals) prefer to be called _she_. (Transsexuals seem much more common than people who just have principled opinions about pronoun reform without any accompanying desire to change what sex other people perceive them as.)
-
-But the _reason_ trans people want this is _because_ they're trying to change their socially-perceived sex category and actually-existing English speakers interpret _she_ and _he_ as conveying sex-category information. People who request _he/him_ pronouns aren't doing it because they want their subject pronoun to be a two-letter word rather than a three-letter word, or because they hate the [voiceless postalveolar fricative](https://en.wikipedia.org/wiki/Voiceless_postalveolar_fricative) (_sh_) sound. They're doing it _because_, in English, those are the pronouns for _males_. If it were _actually true_ that _she_ and _he_ were just two alternative third-person pronouns that could be used interchangeably with no difference in meaning, with the only function of the distinction being collision-avoidance, then _there would be no reason to care_ which one someone used, as long as the referent was clear. But this doesn't match people's behavior: using gender pronouns other than those preferred by the subject is typically responded to as a social attack (as would be predicted by the theory that _she_ and _he_ convey sex-category information and transsexuals don't want to be perceived as their natal sex), not with, "Oh, it took me an extra second to parse your sentence because you unexpectedly used a pronoun different from the one the subject prefers as per convention, but now I understand what you meant" (as would be predicted by the theory that "_he_ refers to the set of people who have asked us to use _he_ [...] and to say that this just _is_ the normative definition").
-
-You can't have it both ways. "That toy is worthless", says one child to another, "_therefore_, you should give it to me." But if the toy were _actually_ worthless, why is the first child demanding it? The problem here is not particularly subtle or hard to understand! If the second child were to appeal to an adult's authority, and the adult replied, "The toy _is_ worthless, so give it to him," you would suspect the grown-up of not being impartial.
-
-"Pronouns shouldn't convey sex-category information, as an apolitical matter of language design," is a fine [motte](https://slatestarcodex.com/2014/11/03/all-in-all-another-brick-in-the-motte/), but it's not consistent with the bailey of, "_Therefore_, when people request that you alter your pronoun usage in order to change the sex-category information being conveyed, you should obey the request." Even if the situation is an artifact of bad language design, as Yudkowsky argues—that in a saner world, this conflict would have never come up—that doesn't automatically favor resolving the conflict in favor of the policy of keeping both _she_ and _he_ but asserting that the difference doesn't mean anything.
-
-This may be clearer to some readers if we consider a distinction less emotionally and politically fraught than sex/gender in the current year. [Many languages have two different second person singular pronouns that distinguish the speaker's relationship to the listener as being more familiar/intimate, or more formal/hierarchical.](https://en.wikipedia.org/wiki/T%E2%80%93V_distinction) In Spanish, for example, [the familiar pronoun is _tú_ and the formal pronoun is _usted_](https://en.wikipedia.org/wiki/Spanish_personal_pronouns#T%C3%BA/vos_and_usted): one would address friends, family members, children, or personal servants as _tú_, but strangers or social superiors as _usted_. Using the wrong pronoun can be the cause of offense or awkwardness. A speaker switching from _usted_ to _tú_ for an interlocutor who they're getting along with might ask if it's okay with _¿Te puedo tutear?_ (Can I call you _tú_?) or _Nos tuteamos, ¿verdad?_ (We call each other _tú_, right?); this is somewhat analogous to an English speaker asking if they may address someone by first name, rather than with a courtesy title or honorific (Ms./Mr. Lastname, or ma'am/sir).
-
-One could argue that the _tú_/_usted_ distinction is bad language design for the same reason Yudkowsky opposes the _she_/_he_ distinction: you shouldn't be forced to make a call on how familiar your relationship with someone is just in order to be able to use a pronoun for them. The modern English way is more flexible: you _can_ indicate formality if you want to by saying additional words, but it's not baked into the grammar itself.
-
-However, if you were going to reform Spanish (or some other language with the second-person formality distinction), you would probably abolish the distinction altogether, and just settle on one second-person singular pronoun. Indeed, that's what happened in English historically—the formal _you_ took over as the universal second-person pronoun, and the informal singular _thou_/_thee_/_thine_ has vanished from common usage. (People still recognize it as a second-person pronoun when encountered in old poetry—"The truth shall be thy warrant", _&c._—but most probably aren't aware of the formality distinction.) You wouldn't keep both forms, but circularly redefine them as referring only to the referent's preferred choice of address (?!).
-
-Similarly, when second-wave feminists objected to the convention of _Miss_ or _Mrs._ forcing speakers to identify a woman's marital status, the response was [to popularize the marriage-agnostic alternative _Ms._](https://en.wikipedia.org/wiki/Ms.#Historical_development_and_revival_of_the_term), not to circularly redefine _Miss_ and _Mrs._
-
-Or consider how previous generations of public intellectuals considered this exact problem. In 1983, Douglas R. Hofstadter also expressed disapproval of _she_ and _he_ as a matter of language design, and to illustrate the point about how alien and unnecessary gendered language would seem if you weren't already used to it, wrote a satirical piece, ["A Person Paper on Purity in Language"](https://www.cs.virginia.edu/~evans/cs655/readings/purity.html), in the persona of a conservative author in a society with race-based (!) language conventions, including the pronouns whe/wis for whites and ble/bler for blacks. In neither the piece itself (during which Hofstadter's alter-ego brings up and rejects a couple of reform suggestions from the liberals of whis Society, including singular _they_), nor the Post-Scriptum in its subsequent [anthologization](https://en.wikipedia.org/wiki/Metamagical_Themas), does Hofstadter entertain the idea of redefining _he_ and _she_ (or _whe_ and _ble_) to refer to the subject's pronoun preference.
-
-It's worth asking: why not? The statement of the objective language-design flaw (pronouns shouldn't denote sex, that's dumb; why would you define a language that way) was _the same_ in 1983 as it is in 2021. If it's so clear to Yudkowsky in 2021 that self-identification is just the "simplest and best protocol" to repair the objective flaw in English's design, why didn't that simplest and best solution occur to Hofstadter in 1983?
-
-Could it, perhaps, be the case that public intellectuals in the current year might have some _other_ motivation to conclude that "_he_ refers to the set of people who have asked us to use _he_", that was not present for their analogues in 1983? But if so, they'd _tell_ us that ... right?
-
-Really, the circular definition shouldn't satisfy _anyone_: people who want someone to call them _usted_ (or _tú_), do so _because_ of the difference in meaning and implied familiarity/respect, in the _existing_ (pre-reform) language. (Where else could such a preference possibly come from?) From an AI design standpoint, the circular redefinition can be seen as a form of ["wireheading"](https://www.lesswrong.com/posts/aMXhaj6zZBgbTrfqA/a-definition-of-wireheading). You want people to respect you as a superior, and if they respected you as a superior, they'd call you _usted_. That could make a policy of coercing people into calling you _usted_ seem superficially appealing. But the appeal solely rests on confusing the pre-reform meaning (under which the choice of _usted_ implies respect and is therefore desirable) and the post-reform meaning (under which the choice implies nothing). Whether or not the proponent of the change consciously _notices_ the problem, the redefinition is _functionally_ "hypocritical": it's only desirable insofar as people aren't _actually_ using it internally.
-
-Indeed, when I look at what contemporary trans activists write, I don't see them approving of this idea that pronoun choices _don't mean anything_. [In the words of one Twitter user](https://twitter.com/AFROlNCOGNlTO/status/13890805920844636180):
-
-> misgendering sucks, but what feels even more violent is when people get my pronouns right and i can tell they still perceive me as a man
-
-In the [words of](https://twitter.com/pangmeli/status/1079097805250224130) [another](https://twitter.com/pangmeli/status/1079142303183327232):
-
-> a lot of cis people use 'learning someone's pronoun' as a copout from doing the important internal work of actually reconsidering their impression of the person's gender
-
-> like let's be real—the reason you have a hard time "remembering" her pronoun is because you don't really think of her as a her. if you practiced thinking of her as a her, her pronoun would just come. and then you wouldn't be privately betraying her in your head all the time.
-
-These authors are to be commended for making their view so clear and explicit: in order to not betray your trans friends (according to this view), you need to think of them as the gender that they say they are. Mere verbal pronoun compliance in the absence of underlying belief is insufficient and possibly treacherous.
-
-This point that pronoun changes are desired precisely _because_ of what they _do_ imply about sex categories in the existing English language is a pretty basic one, that one should think should scarcely need to be explained. And yet Yudkowsky steadfastly ignores the role of existing meanings in this debate, bizarrely writing as if we were defining a conlang from scratch:
-
-> It is Shenanigans to try to bake your stance on how clustered things are and how appropriate it is to discretely cluster them using various criteria, _into the pronoun system of a language and interpretation convention that you insist everybody use!_
-
-There are a couple of problems with this. First of all, the "that you insist everybody use" part is a pretty blatant [DARVO](https://en.wikipedia.org/wiki/DARVO) in the current political environment around Yudkowsky's social sphere. A lot of the opposition to self-chosen pronouns is about opposition to _compelled speech_: people who don't think some trans person's transition should "count"—however cruel or capricious that might be—don't want to be coerced into legitimizing it with the pronoun choices in their _own_ speech. That's different from insisting that _others_ use sex-based non-subject-preferred pronouns, which is not something I see much of outside of gender-critical ("TERF") forums. Characterizing the issue as being about "freedom of pronouns", [as Yudkowsky does in the comment section](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421833274228), elides the fact that freedom to specify how _other people_ talk about you is in direct conflict with the freedom of speech of speakers! No matter which side of the conflict one supports, it seems wrong to characterize the self-ID pronoun side as being "pro-freedom", as if there wasn't any "freedom" concerns on the other side.
-
-If you _actually_ believed it was Shenanigans to bake a stance on how clustered things are into a pronoun system and insist that everyone else use it, then it should be _equally_ Shenanigans independently of whether the insisted-on clusters are those of sex or those of gender identity—if you're going to be consistent, you should condemn them _both_. And yet _somehow_, people who insist on sex-based pronouns are the target of Yudkowsky's condescension, whereas people who insist on gender-identity-based pronouns get both a free pass, _and_ endorsement of their preferred convention (albeit for a different stated reason)? The one-sidedness here is pretty shameless!
-
-Perhaps more important than the speaker-freedom _vs._ subject-freedom issue, however, is that in discussing how to reform English, we're not actually in the position of defining a language from scratch. Even if you think the [cultural evolution](/2020/Jan/book-review-the-origins-of-unfairness/) of English involved Shenanigans, it's not fair to attribute the Shenanigans to native speakers accurately describing their native language. Certainly, language can evolve; words can change meaning over time; if you can get the people in some community to start using language differently, then you have _ipso facto_ changed their language. But when we consider language as an information-processing system, we see that in order to change the meaning associated with a word, you actually _do_ have to somehow get people to change their usage. You can _advocate_ for your new meaning and use it in your own speech, but you can't just _declare_ your preferred new meaning and claim that it applies to the language as actually spoken, without speakers actually changing their behavior. As a result, Yudkowsky's proposal "to say that this just _is_ the normative definition" doesn't work.
-
-To be clear, when I say that the proposal doesn't work, I'm not even saying I disagree with it. I mean that it literally, _factually_ doesn't work! Let me explain.
-
-The "meaning" of language isn't some [epiphenominal](https://www.lesswrong.com/posts/fdEWWr8St59bXLbQr/zombies-zombies) extraphysical fact that can be declared or ascertained separately from common usage. We can only say that the English word "dog" means [these-and-such four-legged furry creatures](https://en.wikipedia.org/wiki/Dog), _because_ English speakers actually use the word that way. [The meaning "lives" in the systematic correspondence between things in the world and what communication signals are sent.](https://www.lesswrong.com/posts/4hLcbXaqudM9wSeor/philosophy-in-the-darkest-timeline-basics-of-the-evolution)
-
-There's nothing magical about the particular word/symbol/phoneme-sequence "dog", of course. In German, they say _Hund_; in Finnish, they say _koira_; in Korean, they say _개_. Germans and Finns and Koreans (and their dogs) seem to be getting along just as well as we Anglophones.
-
-Nevertheless, it is a fact _about contemporary English_ that "dog" means dog. If you thought this was bad for whatever reason, and you wanted to change that fact, you'd have to change the behavior of actually-existing English speakers. If you tried to stipulate on your Facebook wall that the word "dog" should mean _tree_ now, and all of your Facebook friends nodded in agreement at your clever argument _and then continued to call dogs "dogs" and trees "trees" in their everyday life just like they always had_, then your language reform attempt would have, _in fact_, failed—even if the fact that it failed would be less obvious if you only looked at the Facebook thread full of people nodding in agreement.
-
-Or suppose I wrote a Facebook post arguing that it's bad language design that "billion" means 1,000,000,000 instead of 2001. You see, the etymology comes from the prefix [bi-](https://en.wiktionary.org/wiki/bi-) (meaning two, from the Latin _bis_), combined with [_mille_](https://en.wiktionary.org/wiki/mille#Latin) (Latin for 1000), combined with the [augmentive](https://en.wiktionary.org/wiki/augmentative#English) suffix [_-one_](https://en.wiktionary.org/wiki/-one#Italian). How do you get 10<sup>9</sup> from that, huh? (It turns out there's [an explanation](https://en.wiktionary.org/wiki/-illion#English), but I don't find it intuitive.) Clearly, it's better language design if the meaning of number words straightforwardly reflect their parts, so "billion" should mean 2001 (_bi-_, _mille_, -_one_; 2, times 1000, plus 1).
-
-Even if you found this argument compelling from an theoretical language-design perspective after it had been presented to you, if I were to subsequently go around calling myself a _billionaire_ (and condescendingly Tweeting about how anyone objecting to this usage is ontologically confused), you would probably suspect that I probably had some _other reason_ to come up with this _particular_ theoretical language-design argument—probably a reason having to do with what "billion" _already_ means in the usage of actually-existing English speakers, _even if_ you honestly think the existing English language is poorly designed in that aspect.
-
-The inseparability of meaning from behavior-and-usage may be clearer if considered in a context other than that of natural language. Take computer programs. Sometimes programmers make bad design decisions. For example, in the C programming language, [it's standard to represent strings (textual data) in memory with a sequence of bytes ending in a zero (null) character](https://en.wikipedia.org/wiki/Null-terminated_string); the machine only knows where the string stops when it reaches the null at the end. This convention has a lot of disadvantages relative to the alternative of [prefixing the string data with the length](https://en.wikipedia.org/wiki/String_(computer_science)#Length-prefixed); a missing or misplaced null character could cause the machine to erroneously read or write data in adjacent memory, causing serious bugs or security vulnerabilities.
-
-Given the existence of strong arguments for the length-prefixed string convention, replacing old software that uses null-terminated strings with new software that uses length-prefixed strings, sounds like a good idea! But the thing is, you _do_ have to upgrade or replace the old software. If you _just_ start sending data in a new format to the old software that doesn't understand the new format, your code is not going to yield the expected results. It would be _convenient_ if you could just declare a new semantics for your existing data on your Facebook wall and be done, but that just doesn't work if you're still using the old software, which is programmed to behave according to the old data-interpretation convention. This continues to be true even if the convention you're trying to retire is very bad (like null-terminated strings), and if the old software is widely deployed and would be very expensive to systematically replace. The backwards-compatibility trap [is real and can't be defied away even if it's very unpleasant.](https://twitter.com/ESYudkowsky/status/1216799697907486720)
-
-Natural language faces a similar backwards-compatibility trap. The English language, as "software", is _already_ "deployed" [to 370 million brains as native speakers, and another 980 million second-language speakers](https://en.wikipedia.org/wiki/List_of_languages_by_total_number_of_speakers#Top_languages_by_population). And among those hundreds of millions of speakers, there is _already_ a very firmly entrenched convention that _she_ refers to females and _he_ refers to males, such that if you say, "I met a stranger in the park; she was nice", the listener is going to assume the the stranger was (or appeared to be) female, even if you didn't say "The stranger was female" as a separate sentence. If the listener later gets the chance to meet the stranger and the stranger turns out to be (or appear to be) male, the listener is going to be _surprised_: your pronoun choice induced them to [mis-anticipate their experiences](https://www.lesswrong.com/posts/a7n8GdKiAZRX86T5A/making-beliefs-pay-rent-in-anticipated-experiences).
-
-Bad language design? I mean, maybe! You could argue that! You could probably get a lot of Likes on Facebook arguing that! But if 370 million native English speakers _including you and virtually everyone who Liked your post_ are going to _continue_ automatically noticing what sex people are (or appear to be) and using the corresponding pronouns without consciously thinking about it (in accordance with the "default for those-who-haven't-asked" clause of your reform proposal), then the criticism seems kind of idle!
-
-The "default for those-who-haven't-asked [going] by gamete size" part of Yudkowsky's proposal is _trying_ to deal with the backwards-compatibility problem by being backwards-compatible—prescribing the same behavior in the vast majority of cases—but in doing so, it fails to accomplish its stated purpose of de-gendering the language.
-
-To _actually_ de-gender English while keeping _she_ and _he_ (as contrasted to coordinating a jump to universal singular _they_, or _ve_), you'd need to _actually_ shatter the correlation between pronouns and sex/gender, such that a person's pronouns _were_ just an arbitrary extra piece of data that you couldn't deduce from secondary sex characteristics and just needed to remember in the same way you have to remember people's names and can't deduce them from their appearances. But as far as I can tell, _no one_ wants this. When's the last time you heard someone request pronouns for _non_-gender-related reasons? ("My pronouns are she/her—but note, that's _just_ because I prefer the aesthetics of how the pronouns sound; I'm _not_ in any way claiming that you should believe that I'm in any sense female, which isn't true.") Me neither.
-
-But given that pronouns _do_ convey sex-category information, as a _fact_ about how the brains of actually-existing English speakers _in fact_ process language (whether or not this means that English is terribly designed), some actually-existing English speakers might have reason to object when pressured to use pronouns in a way that contradicts their perception of what sex people are.
-
-In an article titled ["Pronouns are Rohypnol"](https://fairplayforwomen.com/pronouns/), Barra Kerr compares preferred pronouns to the famous [Stroop effect](https://en.wikipedia.org/wiki/Stroop_effect). When color words are printed in text of a different color (_e.g._, <span style="color:blue;">red</span>, <span style="color:green">orange</span>, <span style="color:red">yellow</span>, <span style="color:purple">green</span>, <span style="color:orange">blue</span>, _&c._) and people are asked to name the color of the text, they're slow to respond: the meaning of the word interferes with their ability to name the color in front of our eyes.
-
-Kerr suggests that preferred pronouns have a similar effect, that "a conflict between what we see and know to be true, and what we are expected to say, affects us." As an exercise, she suggests (privately!) translating sentences about transgender people to use natal-sex-based pronouns.
-
-Unfortunately, I don't have a study with objective measurements on hand, but I think most native English speakers who try this exercise and introspect—especially using examples where the trans person exhibits features or behavior typical of their natal sex, with things like "she ejaculated" or "he gave birth" being the starkest examples—will agree with Kerr's assessment: "You can know perfectly the actual sex of a male person, and yet you will still react differently if someone calls them _she_ instead of _he_."
-
-Let's relate this is Yudkowsky's specialty of artificial intelligence. In a post on ["Multimodal Neurons in Artificial Neural Networks"](https://openai.com/blog/multimodal-neurons/), Gabriel Goh _et al._ explore the capabilities and biases of the [CLIP](https://openai.com/blog/clip/) neural network trained on textual and image data.
-
-There are some striking parallels between CLIP's behavior, and phenomena observed in neuroscience. Neurons in the human brain have been observed to respond to the same concept represented in different modalities (_e.g._, [Quiroga _et al._](/papers/quiroga_et_al-invariant_visual_representation_by_single_neurons.pdf) observed a neuron in one patient that responded to photos and sketches of actress Halle Berry, as well as the text string "Halle Berry"), and so do CLIP neurons. Futhermore, CLIP is vulnerable to a Stroop-like effect where its image-classification capabilities can be fooled by "typographic attacks"—a dog with instances of the text "$$$" superimposed over it gets classified as a piggy bank, an apple with a handwritten sign saying "LIBRARY" gets classified as a library. The network knows perfectly what dogs and apples look like, and yet still reacts differently if adjacent text calls them something else.
-
-I conjecture that the appeal of subject-chosen pronouns lies _precisely_ in how they exert Stroop-like effects on speakers' and listeners' cognition. (Once again, if it were _actually true_ that _she_ and _he_ had no difference in meaning, _there would be no reason to care_.) [Pronoun badges](/2018/Oct/sticker-prices/) are, quite literally, a typographic attack against native English speakers' brains.
-
-Note, I mean this as a value-free description of how the convention _actually functions_ in the real world, [not a condemnation](https://www.lesswrong.com/posts/N9oKuQKuf7yvCCtfq/can-crimes-be-discussed-literally). One could consistently hold that these "attacks" are morally good. (Analagously, [supernormal stimuli](https://www.lesswrong.com/posts/Jq73GozjsuhdwMLEG/superstimuli-and-the-collapse-of-western-civilization) like chocolate or pornography are "attacks" against the brain's evolved nutrition and reproductive-opportunity detectors, but most people are fine with this, because our goals are not evolution's.)
-
-Is susceptibility to Stroop-like effects an indication of bad mind design? I mean, probably! One would expect that an intelligently-designed agent (as contrasted to messy human brains coughed up [blind evolution](https://www.lesswrong.com/posts/jAToJHtg39AMTAuJo/evolutions-are-stupid-but-work-anyway) or [lucky](https://www.lesswrong.com/posts/dpzLqQQSs7XRacEfK/understanding-the-lottery-ticket-hypothesis) neural networks found by gradient descent) could easily bind and re-bind symbols on the fly, such that a sane AI from the future could use whatever pronouns without dredging up any inapplicable mental associations, and tell you the color of the text "<span style="color:blue;">red</span>" just as easily as "<span style="color:red;">red</span>". But it seems kind of idle to criticize humans for not having a capability (natural language fluency without Stroop-like effects) that we don't even know how to implement in a computer program.
-
-Back to Kerr's article—importantly, Kerr is _explicitly_ appealing to psychological effects of different pronoun conventions. She is absolutely _not_ claiming that the use of preferred pronouns is itself a "lie" about some testable proposition. She writes:
-
-> I've heard many people tell me they don't mind doing this, as a courtesy, although it takes some effort to keep up the mental gymnastics of perceiving one sex, but consistently using pronouns for the other. That's a personal choice, and I respect the reasons why some people make it.
-
-> I've also heard many people declaring that anyone who won't comply (usually directed at a woman) is obnoxious, mean, hostile, and unpleasant. 'Misgendering' is hate speech. They say.
-
-> But I refuse to use female pronouns for anyone male.
-
-Note the wording: "That's a personal choice", "_I_ refuse". Kerr knows perfectly well that people who use gender-identity-based pronouns aren't making a false claim that trans men produce sperm, _&c._! Rather, she's saying that a pronoun convention that groups together females, and a minority of males who wish they were female, affects our cognition about that minority of males in a way that's disadvantageous to Kerr's interests (because she wants to be especially alert to threats posed by males), such that Kerr refuses to comply with that convention in her own speech. (Compare to how a Spanish speaker might refuse to address someone they disrespected as _usted_ because of its connotations, without thereby claiming that using _usted_ would make the sentence literally false.)
-
-Relatedly, [critics of this blog](/2020/Nov/the-feeling-is-mutual/) sometimes refer to me as _she_, reflecting their belief that I'm a trans woman in denial, even though I think of myself of a man ([adult human male](/2018/Apr/reply-to-the-unit-of-caring-on-adult-human-females/) not trying to appear otherwise). I never correct them—not just because [it's kind of flattering](/2021/May/interlude-xxi/), and not just because I don't think of myself as having the right to dictate how other people talk about me—but because "she" _is_ the correct pronoun to convey the meaning _they're_ trying to express, whether or not _I_ agree with it.
-
-I take pains to emphasize that pronouns can have meaningful semantics without being denotative statements that can be straightforwardly "false", because Yudkowsky misrepresents what his political opponents are typically claiming, repeatedly trying to frame the matter of dispute as to whether pronouns can be "lies" (to which Yudkowsky says, No, that would be ontologically confused)—whereas if you _actually read_ what the people on the other side of the policy debate are saying, they're largely _not claiming_ that "pronouns are lies"!
-
-This misrepresentation is a serious problem because, [as Yudkowsky pointed out in 2007](https://www.lesswrong.com/posts/qNZM3EGoE5ZeMdCRt/reversed-stupidity-is-not-intelligence), "To argue against an idea honestly, you should argue against the best arguments of the strongest advocates. Arguing against weaker advocates proves _nothing_, because even the strongest idea will attract weak advocates." By [selectively drawing attention to the weaker form of the argument](https://slatestarcodex.com/2014/05/12/weak-men-are-superweapons/), Yudkowsky is likely to leave readers who trusted him to be fair with an unrealistic picture of what people on the other side of the issue actually believe. (Kerr's article seems representative of gender-critical ("TERF") concerns; I've seen the post linked in those circles more than once, and it's cited in [embattled former University of Sussex professor Kathleen Stock](https://en.wikipedia.org/wiki/Kathleen_Stock#Views_on_gender_self-identification)'s book _Material Girls_.)
-
-Anyway, given these reasons why the _existing_ meanings of _she_ and _he_ are relevant to the question of pronoun reform, what is Yudkowsky's response?
-
-Apparently, to play dumb. In the comments of the Facebook post, Yudkowsky mentions encountering exotic pronouns on [LambdaMOO](https://en.wikipedia.org/wiki/LambdaMOO) at age 13 and no one thinking anything of them, and [goes on to claim](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421986539228&reply_comment_id=10159423713134228):
-
-> I do not know what it feels like from the inside to feel like a pronoun is attached to something in your head much more firmly than "doesn't look like an Oliver" is attached to something in your head.
-
-...
-
-I'm sorry, but I can't take this self-report literally. I certainly [don't think Yudkowsky was _consciously_ lying](https://www.lesswrong.com/posts/bSmgPNS6MTJsunTzS/maybe-lying-doesn-t-exist) when he wrote that. (When speaking or writing quickly without taking the time to [scrupulously check every sentence](https://www.lesswrong.com/posts/xdwbX9pFEr7Pomaxv/meta-honesty-firming-up-honesty-around-its-edge-cases#2__The_law_of_no_literal_falsehood_), it's [common for little untruths and distortions to slip into one's speech](https://www.lesswrong.com/posts/pZSpbxPrftSndTdSf/honesty-beyond-internal-truth). Everyone does it, and if you think you don't, then you're lying.)
-
-Nevertheless, I am _incredibly_ skeptical that Yudkowsky _actually_ doesn't know what it feels like from the inside to feel like a pronoun is attached to sex categories more firmly than a given name is attached to someone's appearance.
-
-I realize this must seem impossibly rude, presumptuous, and uncharitable of me. Yudkowsky _said_ he doesn't know what it feels like from the inside! That's a report out his own mental state, which he has privileged introspective access to, and I don't! What grounds could I possibly, _possibly_ have to think he's not telling the truth about his own mind? 
-
-It's a good question. And my answer is, even without mind-reading technology, people's minds are still part of the same cause-and-effect physical universe that I can (must) make probabilistic inferences about, and verbal self-reports aren't my _only_ source of evidence about someone's mind. In particular, if someone's verbal self-report mis-predicts what we know about their _behavior_, it's far from clear that we should trust the report more than our senses.
-
-And the thing is, Eliezer Yudkowsky is a native English speaker born in 1979. As a native English speaker born in 1987, I have a _pretty good_ mental model of how native English speakers born in the late 20th century use language. And one of the things native English speakers born in the late 20th century are _very good_ at doing, is noticing what sex people are and using the corresponding pronouns without consciously thinking about it, because the pronouns are attached to the concept of sex in their heads more firmly than proper names are attached to something in their heads.
-
-I would bet at very generous odds at some point in his four decades on Earth, Eliezer Yudkowsky has used _she_ or _he_ on the basis of perceived sex to refer to someone whose name he didn't know. Because _all native English speakers do this_. Moreover, we can say something about the [cognitive algorithm](https://www.lesswrong.com/posts/HcCpvYLoSFP4iAqSz/rationality-appreciating-cognitive-algorithms) underlying _how_ they do this: for example, [people can recognize sex from facial photos _alone_ (hair covered, males clean-shaven) at 96% accuracy](/papers/bruce_et_al-sex_discrimination_how_do_we_tell.pdf). In naturalistic settings where we can see and hear more [secondary sex characteristics](https://en.wikipedia.org/wiki/Secondary_sex_characteristic#In_humans) than just someone's face (build, height, breasts, [voice](/papers/puts_et_al-masculine_voices_signal_mens_threat_potential.pdf), [gait](https://sillyolme.wordpress.com/2010/09/24/all-the-wrong-moves/), _&c_.), accuracy would be even greater. It's not a mystery why people can get sex-based pronouns "right" the vast majority of the time without having to be told or remember specific people's pronouns.
-
-Conversely, I would also bet at very generous odds that in his four decades on Earth, Eliezer Yudkowsky has very rarely if ever assumed what someone's name is on the basis of their appearance without being told. Because _no native English speakers do this_ (seriously, rather than as a joke or a troll). Now, it's true that the "doesn't look like an Oliver" example _was_ introduced into the discussion by another commenter, [who recounts once having called someone Bill who had introduced himself as Oliver](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421986539228&reply_comment_id=10159422872574228):
-
-> It did feel a little weird calling him Oliver, but everyone present knew what I was doing was being a jerk and teenagers are horrible. The "feels like lying" principle seems like it lets me keep calling him Bill, now righteously. I just can't even really bring myself to play in that sandbox in good faith.
-
-But the "everyone present knew what I was doing was being a jerk" characterization seems to agree the the motivation was joking/trolling. _How_ did everyone present know? Because it's absurd to infer a _particular_ name from someone's appearance.
-
-It's true that there are name–feature correlations that people can pick up on. For example, a "Juan" is likely to be Latino, a "Gertrude" in the current year is [likely to be old](https://www.everything-birthday.com/name/f/Gertrude); a non-Hispanic white Juan or a young Gertrude may indeed be likely to provoke a "Doesn't look like an _X_" reaction (which may also be sensitive to even subtler features). But while probabilistic inferences from features to low _likelihood_ of a particular name are valid, an inference from features to a particular name is absolutely not, because the function of a name is to be an opaque "pointer" to a particular individual. A Latino family choosing a name for their male baby may be somewhat more likely to choose "Juan" rather than "Oliver" (or "Getrude"), but they could just as easily choose "Luis" or "Miguel" or "Alejandro" for the very same child, and there's no plausible physical mechanism by which a horrible teenager thirty years later could tell the difference.
-
-Thus, I reject the commenter's claim that "feels like lying" intuitions about pronouns and sex would have let her "keep calling him Bill, now righteously". What algorithm you would use to infer that someone's name is "Bill" or "Oliver" based on how they look? What are the "secondary Oliver characteristics", specifically? People for whom it was _actually true_ that names map to appearances the way pronouns map to sex, should not have trouble answering this question!
-
-If there _were_ a substantial contingent of native English speakers who don't interpret pronouns as conveying sex category information, one would expect this to show up in our cultural corpus more often—and yet, I'm actually not aware of any notable examples of this. In contrast, it's very easy to find instances of speakers treating pronouns and sex as synonymous. As an arbitrarily chosen example, in [one episode](https://theamazingworldofgumball.fandom.com/wiki/The_Nest) of the animated series [_The Amazing World of Gumball_](https://tvtropes.org/pmwiki/pmwiki.php/WesternAnimation/TheAmazingWorldOfGumball) featuring the ravenous spawn of our protagonists' evil pet turtle, the anthropomorphic-rabbit [Bumbling Dad](https://tvtropes.org/pmwiki/pmwiki.php/Main/BumblingDad) character [says, "Who's to say this pregnant turtle is a _her_?" and everyone gives him a look](https://www.youtube.com/watch?v=5N2Msnrq7wU&t=14s).
-
-The joke, you see, is that bunny-father is unthinkingly applying the stock question "Who's to say _X_ is a he/she?" (which makes sense when _X_ is, _e.g._, "the nurse") in a context where there's an obvious answer—namely, that the referents of "her" pronouns are female and only females get pregnant—but the character is too stupid to notice this, and we enjoy a laugh at his expense.
-
-_The Amazing World of Gumball_ is rated [TV-Y7](https://rating-system.fandom.com/wiki/TV-Y7) and the episode in question came out in 2016. This is not a particularly foreign or distant cultural context, nor one that is expected to tax the cognitive abilities of a seven-year-old child! Is ... is Yudkowsky claiming not to get the joke?
-
-Posed that way, one would imagine not—but if Yudkowsky _does_ get the joke, then I don't think he can simultaneously _honestly_ claim to "not know what it feels like from the inside to feel like a pronoun is attached to something in your head much more firmly than 'doesn't look like an Oliver' is attached to something in your head." In order to get the joke in real time, your brain has to quickly make a multi-step logical inference that depends on the idea that pronouns imply sex. (The turtle is a "her" [iff](https://en.wikipedia.org/wiki/If_and_only_if) female, not-female implies not-pregnant, so if the turtle is pregnant, it must be a "her".) This would seem, pretty straightforwardly, to be a sense in which "a pronoun is attached to something in your head much more firmly than 'doesn't look like an Oliver' is attached to something in your head." How else am I supposed to interpret those words?
-
-Perhaps it's not justified to question Yudkowsky's "I do not know what it feels like [...]" self-report based on generalizations about English speakers in general? Maybe his mind works differently, but dint of unusual neurodiversity or training in LambdaMOO? But if so, one would perhaps expect some evidence of this in his publicly observable writing? And yet, on the contrary, looking over his works, we can see instances of Yudkowsky treating pronouns as synonymous with sex/gender (just as one would expect a native English speaker born in 1979 to do), contrary to his 2021 self-report of not knowing what this feels like from the inside.
-
-For example, in Yudkowsky's 2001 _Creating Friendly AI: The Analysis and Design of Benevolent Goal Architectures_, the text "If a human really hates someone, she" is followed by [footnote 16](https://web.archive.org/web/20070615130139/http://singinst.org/upload/CFAI.html#foot-15): "I flip a coin to determine whether a given human is male or female." Note, "_is_ male or female", not "which pronoun to use." The text would seem to reflect the common understanding that _she_ and _he_ do imply sex specifically (and not some other thing, like being named Oliver), even if flipping a coin (and drawing attention to having done so) reflects annoyance that English requires a choice.
-
-A perhaps starker example comes in the comments to Yudkowsky's 2009 short story ["The Hero With A Thousand Chances"](https://www.lesswrong.com/posts/EKu66pFKDHFYPaZ6q/the-hero-with-a-thousand-chances). A commenter (in the guise of a decision theory thought experiment) inquired whether Yudkowsky flipped a coin to determine the protagonist's gender, [to which Yudkowsky replied](https://www.lesswrong.com/posts/EKu66pFKDHFYPaZ6q/the-hero-with-a-thousand-chances?commentId=dyADWqquWFHeNMQiJ) (bolding mine):
-
-> Ha! I _tried_ doing that, the generator came up female ... and **I realized that I couldn't make Aerhien a man**, and that having two "hers" and "shes" would make the dialogue harder to track.
->
-> Sometimes a random number generator only tells you what you already know.
-
-But the text of the story doesn't _say_ Aerhien isn't a "man"; it merely refers to her with she/her pronouns! If Yudkowsky "couldn't make [the character] a man", but the only unambiguous in-text consequence of this is that the chacter takes she/her pronouns, that would seem to be treating sex and pronouns as synonymous; the comment _only makes sense_ if Yudkowsky thinks the difference between _she_ and _he_ is semantically meaningful. (It's possible that he changed his mind about this between 2009 and 2021, but if so, you'd expect the 2021 Facebook discussion to explain why he changed his mind, rather than claiming that he "do[es] not know what it feels like from the inside" to hold the position implied by his 2009 comments.)
-
-In the Facebook comments, Yudkowsky continues:
-
-> My current policy stance is that anybody who does feel that way needs to get some perspective about how it can be less firmly attached in other people's heads; and how their feelings don't get to control everybody's language protocol or accuse non-protocol users of lying; especially when different people with firm attachments have _different_ firm attachments and we can't make them all be protocol.
-
-The sheer _chutzpah_ here is jaw-dropping. Someone's feelings don't get to control everybody's language protocol, huh? But—the causal–historical reason we're discussing pronoun reform _at all_ is _precisely_ to let trans people's feelings control everybody's language protocol! The original post is very explicit about this! It says:
-
-> Even _before_ considering all gender issues, there is some sense in which somebody saying "help help pronouns attacking" sounds to me like a sympathetic innocent asking to get out from under a bad system, not like a law-deuniversalizer asking for exceptions from a good system.
->
-> In terms of important things? Those would be all the things I've read—from friends, from strangers on the Internet, above all from human beings who are people—describing reasons someone does not like to be tossed into a Male Bucket or Female Bucket, as it would be assigned by their birth certificate, or perhaps at all.
-
-Okay, so Yudkowsky never thought sex-based pronouns were a good idea in the first place. But the _important thing_, he says, is that some people ("who are people", Yudkowsky pleonastically clarifies, as if anyone had doubted this) don't want other people to use language that refers to what sex they are.
-
-Personally, I have a _lot_ of sympathy for this, because in an earlier stage of my ideological evolution, I _was_ one of those people. (I [tried to use an ostensibly gender-neutral nickname and byline for a while in the late 'aughts](/2021/May/sexual-dimorphism-in-the-sequences-in-relation-to-my-gender-problems/#literary-initials), and while I never asked for new pronouns, this is probably a matter of Overton window placement rather than any underlying difference in sentiments; it seems pretty likely that my analogue growing up in the current year's ideological environment would be a trans woman.)
-
-But it's important to not use sympathy as an excuse to blur together different rationales, or obfuscate our analysis of the costs and benefits to different parties of different policies. "Systematically de-gender English because that's a superior language design" and "Don't misgender trans people because trans people are sympathetic" are _different_ political projects with different victory conditions: victory for the de-genderers would mean singular _they_ or similar for everyone (as a matter of language design, no idiosyncratic personal exceptions), which is very different from the [ask-and-share-pronouns norms](https://www.mypronouns.org/asking) championed by contemporary trans rights activists.
-
-Perhaps it might make sense for adherents of a "degender English" movement to stategically _ally_ with the trans rights movement: to latch on to gender-dysphoric people's pain as a political weapon to destabilize what the English-degenderers think of as a bad pronoun system for _other reasons_. Fine.
-
-But if that's the play you want to make, you forfeit the right to _honestly_ claim that your stance is that "feelings don't get to control everybody's language protocol". If you piously proclaim that the "important thing" is trans people's feelings of "not lik[ing] to be tossed into a Male Bucket or Female Bucket, as it would be assigned by their birth certificate", that would seem, pretty straightforwardly, to be participating in an attempt to make it so that "[someone's] feelings [...] get to control everybody's language protocol"! Again, how else am I supposed to interpret those words?
-
-There's nothing _inconsistent_ about believing that trans people's feelings matter, and that the feelings of people who resent the Stroop-like effect of having to speak in a way that contradicts their own sex-category perceptions, don't matter. (Or don't matter _as much_, quantitatively, under the utilitarian calculus.) But if that were your position, the intellectually honest thing to tell people like Barra Kerr is, "Sorry, I'm participating in a political coalition that believes that trans people's feelings are more important than yours with respect to this policy question; sucks to be you", rather than haughtily implying that people like Kerr are making an elementary philosophy mistake that they are _clearly not making_ if you _actually read what they write_.
-
-(In general, an honest "sucks to be you" from someone whose political incentives lead them to oppose your goals, is _much_ less cruel than the opponent distorting your position to make you look bad to their followers.)
-
-All this having been said, Yudkowsky _is_ indeed correct to note that "when different people with firm attachments have _different_ firm attachments [...] we can't make them all be protocol". It's possible for observers to disagree about what sex category they see someone as belonging to, and it would be awkward at best for different speakers in a conversation to use different pronouns to refer to the same subject.
-
-As it happens, I think this _is_ an important consideration in favor of self-identity pronouns! [When different parties disagree about what category something should belong to, but want to coordinate to use the _same_ category, they tend to find some mutually-salient Schelling point to settle the matter.](https://www.lesswrong.com/posts/edEXi4SpkXfvaX42j/schelling-categories-and-simple-membership-tests) In the case of disagreements about a person's social sex category ("gender"), in the absence of a trusted central authority to break the symmetry among third parties' judgements (like a priest or rabbi in a tight-knit religious community, or a medical bureaucracy with the social power to diagnose who is "legitimately" transsexual), the most obvious Schelling point is to defer to the person themselves. I wrote about this argument in a previous post, ["Self-Identity Is a Schelling Point"](/2019/Oct/self-identity-is-a-schelling-point/).
-
-But crucially, the fact that the self-identity convention is a Schelling point, _doesn't_ mean we have a [one-sided policy debate](https://www.lesswrong.com/posts/PeSzc9JTBxhaYRp9b/policy-debates-should-not-appear-one-sided) where it's in everyone's interests to support this "simplest and best protocol", with no downsides or trade-offs for anyone. The thing where _she_ and _he_ (which we don't know how to coordinate a jump away from) imply sex category inferences to actually-existing English speakers is still true! The Schelling point argument just means that the setup of the social-choice problem that we face happens to grant a structural advantage to those who favor the self-identity convention.
-
-Although they're not the only ones with an structural advantage: a social order whose gender convention was "Biological sex only; transsexualism isn't a thing; sucks to be you if you want people to believe that you're the sex that you aren't" would _also_ be a Schelling point. (Trans people's [developmental sex](http://unremediatedgender.space/2019/Sep/terminology-proposal-developmental-sex/) is not really in dispute.) It's the _moderates_ who want to be nice to trans people _without_ destroying the public concept of sex who are in trouble!
-
-Still, I think most people reading this post _are_ "moderates" in this sense. Schelling points are powerful. If we're _not_ culturally-genocidal extremists who want to exclude transsexuals from Society (and therefore reject the "pronouns = sex, no exceptions" Schelling point), isn't it reasonable that we end up at the self-identity Schelling point—at least as far as the trivial courtesy of pronouns is concerned, even if some of the moderates want to bargain for the right to use natal-sex categories in some contexts?
-
-Sure. Yes. And indeed, I don't misgender people! (In public. Only rarely in private, when someone's transition doesn't seem legitimate or serious to me, or when talking to my politically reactionary friends.) I'm not arguing that Yudkowsky should misgender people! The purpose of this post is not to argue with Yudkowsky's pronoun usage, but rather to argue with the offered usage _rationale_ that "the simplest and best protocol is, '"He" refers to the set of people who have asked us to use "he", with a default for those-who-haven't-asked that goes by gamete size' and to say that this just _is_ the normative definition."
-
-As I have explained at length, this _rationale_ doesn't work and isn't true (even if better rationales, like sincere belief in gender identity, or the Schelling point argument, can end up recommending the same behavior). _No one_ actually believes (as contrasted to [believing that they believe](https://www.lesswrong.com/posts/CqyJzDZWvGhhFJ7dY/belief-in-belief)) that _she_ and _he_ aren't attached to gender in people's heads, despite Yudkowsky's sneering claim in the comments that he ["would not know how to write a different viewpoint as a sympathetic character."](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421986539228&reply_comment_id=10159423713134228)
-
-Again, without attributing to Yudkowsky any _conscious, deliberative_ intent to deceive (because of the tragic human tendency to unconsciously introduce distortions in the heat of a rapid argument), the _pants-on-fire audacity_ of this _ludicrous_ claim to ignorance still beggars belief. As the author of [one of the world's most popular _Harry Potter_ fanfictions](http://www.hpmor.com/), Yudkowsky clearly knows something about about how to simulate alternative perspectives (includes ones he disagrees with) and portray them sympathetically. And he claims to be _unable_ to do this for ... the idea that pronouns imply sex, and that using the pronouns that imply someone is the sex that they are not feels analogous to lying? Really?!
-
-Well, I'm not a popular fiction author with thousands of obsessive fans who pour over my every word, but if Yudkowsky claims not to be up to this writing challenge, I'm happy to give him a hand and show him how it might be done—
-
-<p class="flower-break">⁕ ⁕ ⁕</p>
-
-A cis woman is testifying in court about a brutal rape that horrifically traumatized her. The rapist has since transitioned.
-
-"And then—" says the victim, reliving those awful moments, "and then, he took his erect penis—"
-
-"Objection!" says the defense lawyer. "The witness misgendering my client is prejudicial."
-
-"Sustained," says the judge. Then, to the victim: "_Her_ erect penis."
-
-"Wh—what?" says the victim.
-
-"You will refer to the defendant with the correct pronoun, or I'll hold you in contempt of court."
-
-"Oh. O–okay. And then she took her—" The victim breaks down crying. "I'm sorry, Your Honor; I can't do it. I'm under oath; I have to tell the story the way it happened to me. In my memories, the person who did those things to me was a man. A—"
-
-She hesistates, sobs a few more times. In this moment, almost more than the memories of the rape, she is very conscious of having never gone to college. The judge and the defense lawyer are smarter and more educated than her, and _they_ believe that the man who raped her is now (or perhaps, always had been) a woman. It had never made any sense to her—but how could she explain to an authority figure who she had no hope of out-arguing, if she was even allowed to argue?
-
-"And by 'man', I mean—a male. The way I was raised, men—males—get called _he_ and _him_. If I say _she_, it doesn't feel true to the memory in my head. It—it feels like lying, Your Honor."
-
-The judge scoffs. "You are _ontologically_ confused," he sneers. "At age 13 I was programming on LambdaMOO where people had their choice of exotic pronouns and nobody thought anything of it," says the judge. "Denied."
-
-"O-okay," says the victim. She doesn't know what _ontologically_ means, or what a LambdaMOO is. "So then—then sh-she took her erect penis and she—"
-
-She breaks down crying again. "Your Honor, I can't! I can't do it! It's not true! It's not—" She senses that the judge will imply she's stupid for saying it's not true. She gropes for some way of explaining. "I mean—the Court allows people to testify in Spanish or Chinese with the help of a translator, right? Can't you treat my testimony like that? Let me say what happened to me in the words that seems true to me, even if the court does its business using words in a different way?"
-
-"You're in contempt," says the judge. "Baliff! Take her away!"
-
-<p class="flower-break">⁕ ⁕ ⁕</p>
-
-Not a sympathetic character? Not even a little bit?
-
-I suspect some readers will have an intuition that my choice of scenario is loaded, unfair, or unrealistic. To be sure, I chose it an unusually clear-cut case for why someone might have a need to use pronouns to imply sex in their _own_ speech. (If the scenario was just talking about someone borrowing a vacuum cleaner, fewer readers would have any sympathy for someone not wanting to concede the trivial courtesy of preferred pronouns.)
-
-But what, specifically, is unrealistic about it? Is it the idea that a trans woman could have raped someone before transitioning? Of course _most_ trans women are not sex offenders—just as _most_ non-transsexual males are not sex offenders—but instances of trans women committing the kinds of sex crimes that overwhelmingly the provenance of men [are a documented thing](https://fairplayforwomen.com/transgender-male-criminality-sex-offences/).
-
-Is it the idea that the legal system would penalize someone for pronoun non-compliance? But this is also an occasionally documented thing, as in [one case where a Canadian father was jailed](https://www.city-journal.org/canadian-father-jailed-for-speaking-out-about-trans-identifying-child) for violating [a court order](https://www.bccourts.ca/jdb-txt/sc/19/06/2019BCSC0604.htm) not to refer to his natal-female child with she/her pronouns. As liberal intellectuals debating optimal communication policies, we usually hope to govern by consensus: we want people to use preferred pronouns _voluntarily_, rather than being forced. But maintaining a collective norm in the face of those who have their own reasons to object to it, does ultimately require some sort of threat. In the vignette above, given the defense lawyer's objection; the judge does face a forced choice to Sustain or Overrule, and that choice has consequences either way.
-
-In the comments, Yudkowsky continues:
-
-> This is _not_ the woke position. The woke position is that when you call somebody "she" because she requested "she", you're validating her gender preference. I may SEPARATELY be happy to validate somebody's gender preference by using the more complex language feature of NOUN PHRASES to construct an actual SENTENCE that refers to her ON PURPOSE as a "woman", but when it comes to PRONOUNS I am not even validating anyone.
-
-Right, it's not the woke position. It's an _incoherent_ position that's optimized to concede to the woke the behavior that they want for a _different stated reason_ in order to make the concession appear "neutral" and not "politically" motivated. She requested "she" _because_ acceding to the request validates her gender preference in the minds of all native English speakers who are listening, even if Eliezer Yudkowsky has some clever casuistry for why it magically doesn't mean that when _he_ says it.
-
-I'm _not_ saying that Yudkowsky should have a different pronoun policy. (I agree that misgendering all trans people "on principle" seems very wrong and unappealing.) Rather, I'm saying that in order to _actually_ be politically neutral in your analysis of _why_ someone might choose one pronoun policy over another, you need to _acknowledge_ the costs and benefits of a policy to different parties, and face the unhappy fact that sometimes there are cases where there _is_ no "neutral" policy, because all available policies impose costs on _someone_ and there's no solution that everyone is happy with. (Rational agents can hope to reach _some_ point on the Pareto frontier, but non-identical agents are necessarily going to fight about _which_ point, even if most of the fighting takes place in non-realized counterfactual possible worlds rather than exerting costs in reality.)
-
-Policy debates should not appear one-sided. Exerting social pressure on (for example) a native-English-speaking rape victim to refer to her male rapist with _she_/_her_ pronouns is a _cost_ to her. And, simultaneously, _not_ exerting that pressure is a _cost_ to many trans people, by making recognition of their social gender _conditional_ on some standard of good behavior, rather than an unconditional fact that doesn't need to be "earned" or justified in any way.
-
-You might think the cost of making the rape victim say _she_ is worth it, because you want to make it easy for gender-dysphoric people to socially transition, and because you think it's dumb that pronouns imply sex in the actually-existing English language and you see the self-identity convention as an incremental step towards degendering the language.
-
-Fine. That's a perfectly coherent position. But if that's your position and you care about being intellectually honest, you need to _acknowledge_ that your position exerts costs on some actually-existing English speakers who have a use-case for using pronouns to imply sex. You need to be able to look that rape victim in the eye and say, "Sorry, I'm participating in a political coalition that believes that trans people's feelings are more important than yours with respect to this policy question; sucks to be you."
-
-And of course—it _should_ be needless to say—this applies symmetrically. If you think speakers _should_ be able to misgender according to their judgement and you care about being intellectually honest, you need to be able to look a trans person in the eye and say, "Sorry, I'm participating in a political coalition that believes the freedom of speech of speakers is more important than your gender being recognized; sucks to be you."
-
-Or if you have more important things to worry about (like the fate of a hundred thousand galaxies depending on the exact preferences built into the first artificial superintelligence) and don't want the distraction of taking a position on controversial contemporary social issues, fine: use whatever pronoun convention happens to be dominant in your local social environment, and, if questioned, say, "I'm using the pronoun convention that happens to be dominant in my local social environment." You don't have to invent _absurd lies_ to make it look like the convention that happens to be dominant in your local social environment has no costs.
-
-Really, "I do not know what it feels like from the inside to feel like a pronoun is attached to something in your head much more firmly than 'doesn't look like an Oliver'"? Any seven-year-old in 2016 could have told you that that's just _factually not true_; if you grew up speaking English in the late 20th century, you _absolutely goddamned well do_ know what it feels like. Did [the elephant in Yudkowsky's brain](https://en.wikipedia.org/wiki/The_Elephant_in_the_Brain) really expect to get away with that? How dumb does he think we are?!
-
------
-
-At this point, some readers may be puzzled as to the _mood_ of the present post. I _agree_ with Yudkowsky's analysis of the design flaw in English's pronoun system. I _also_ agree that not misgendering trans people is a completely reasonable thing to do, which I also do. I'm _only_ disputing the part where Yudkowsky jumps to declaring his proposed "simplest and best protocol" without acknowledging the ways in which it's _not_ simple and not _unambiguously_ the best.
-
-Many observers would consider this a very minor disagreement, not something anyone would want to spend 12,000 words prosecuting with as much vitriolic rhetoric as the target audience is likely to tolerate. If I agree with the problem statement (pronouns shouldn't denote sex, that's dumb; why would you define a language that way), and I don't disagree with the proposed policy solution (don't misgender trans people in public), why get so hung up on the exact arguments?
-
-(I mean, _besides_ [the fact that it's arguments that matter rather than conclusions, as a completely general principle of correct cognition](https://www.lesswrong.com/posts/34XxbRFe54FycoCDw/the-bottom-line).)
-
-I guess for me, the issue is that this is a question where _I need the correct reasoning in order to make extremely impactful social and medical decisions_. Let me explain.
-
-This debate looks very different depending on whether you're coming into it as someone being _told_ that you need to change your pronoun usage for the sake of someone who will be very hurt if you don't—or whether you're in the position of wondering whether it makes sense to _make_ such a request of others.
-
-As a good cis ally, you're told that trans people know who they are and you need to respect that [on pain of being responsible for someone's suicide](/2018/Jan/dont-negotiate-with-terrorist-memeplexes/). While politically convenient for people who have _already_ transitioned and don't want anyone second-guessing their identity, I think this view is actually false. Humans don't have an atomic "gender identity" that they just _know_, which has no particular properties other than it being worse than death for it to not be recognized by others. Rather, there are a variety of reasons why someone might feel sad about being the sex that they are, and wish they could be the other sex instead, which is called "gender dysphoria."
-
-Fortunately, our Society has interventions available to approximate changing sex as best we can with existing technology: you can get hormone replacement therapy (HRT), genital surgery, ask people to call you by a different name, ask people to refer to you with different pronouns, get new clothes, get other relevant cosmetic surgeries, _&c._ In principle, it's possible to pick and choose some of these interventions piecemeal—[I actually tried just HRT for five months in 2017](http://unremediatedgender.space/tag/hrt-diary/)—but it's more common for people to "transition", to undergo a correlated _bundle_ of these interventions to approximate a sex change.
-
-On this view, there's not a pre-existing fact of the matter as to whether someone "is trans" as an atomic identity. Rather, gender-dysphoric people have [the option to _become_ trans](https://thingofthings.wordpress.com/2016/04/11/1327/) by means of undergoing the bundle of interventions that constitute transitioning, if they think it will make their life better. But in order for a gender-dysphoric person to _decide_ whether transitioning is a good idea with benefits that exceed the costs, they need _factually accurate information_ about the nature of their dysphoria and each of the component interventions.
-
-If people in a position of intellectual authority provide _inaccurate_ information about transitioning interventions, that's making the lives of gender-dysphoric people worse, because agents with less accurate information make worse decisions (in expectation): if you have the facts wrong, you might wrongly avoid an intervention that would have benefitted you, or wrongly undergo an intevention that harms you.
-
-For example, I think my five-month HRT experiment was a _good_ decision—I benefitted from the experience and I'm very glad I did it, even though I didn't end up staying on HRT long term. The benefits (satisfied curiosity about the experience, breast tissue) exceeded the costs (a small insurance co-pay, sitting through some gatekeeping sessions, the inconvenience of [wearing a patch](/2017/Jan/hormones-day-33/) or [taking a pill](/2017/Jul/whats-my-motivation-or-hormones-day-89/), [various slight medical risks including to future fertility](https://srconstantin.github.io/2016/10/06/cross-sex-hormone-therapy.html)).
-
-If someone I trusted as an intellectual authority had falsely told me that HRT makes you go blind and lose the ability to hear music, _and I were dumb enough to believe them_, then I wouldn't have done it, and I would have missed out on something that benefitted me. Such an authority figure would be harming me by means of giving me bad information; I'd be better off if I hadn't trusted them to tell me the truth.
-
-In contrast, I think asking everyone in my life to use she/her pronouns for me would be an _obviously incredibly bad decision_. Because—notwithstanding my clean-shavenness and beautiful–beautiful ponytail and slight gynecomastia from that HRT experiment five years ago—anyone who looks at me can see at a glance that I'm male (as a _fact_ about the real world, however I feel about it). People would comply because they felt obligated to (and apologize profusely when they slipped up), but it wouldn't come naturally, and strangers would always get it wrong without being told—_in accordance with_ the "default for those-who-haven't-asked that goes by gamete size" clause of Yudkowsky's reform proposal, but really because pronouns are firmly attached to sex in their heads. The costs (this tremendous awkwardness and fakeness suffusing _all future social interactions involving me_) would exceed the benefits (I actually do feel happier about the word _she_).
-
-I used to trust Yudkowsky as an intellectual authority; his [Sequences](https://www.readthesequences.com/) from the late 'aughts were so life-alteringly great that I built up a trust that if Eliezer Yudkowsky said something, that thing was probably so, even if I didn't immediately understand why. But these days, Yudkowsky is telling me that 'she' normatively refers to the set of people who have asked us to use 'she', and that those who disagree are engaging in logically rude Shenanigans. However, as I have just explained at length, this is bullshit. (Declaring a "normative" meaning on your Facebook wall doesn't rewrite the _actual_ meaning encoded in the brains of 370 million English speakers.) If I were _dumb enough to believe him_, I might ask people for new pronouns, which would obviously be an incredibly bad decision. (It might be a _less_ bad decision if done in conjunction with a serious gender transition effort, but Yudkowsky's pronoun reform proposal doesn't _say_ "she" is the pronoun for fully-transitioned trans women; it just says you have to ask.) Yudkowsky is harming a reference class of people that includes more naïve versions of me by giving them bad information; I'm better off because I don't trust Eliezer Yudkowsky to tell the truth.
-
-(I guess I [can't say I wasn't warned](https://www.lesswrong.com/posts/wustx45CPL5rZenuo/no-safe-defense-not-even-science).)
-
------
-
-If Yudkowsky is obviously playing dumb (consciously or not) and his comments can't be taken seriously, what's _actually_ going on here? When smart people act dumb, [it's usually wisest to assume that their behavior represents _optimized_ stupidity](https://www.lesswrong.com/posts/sXHQ9R5tahiaXEZhR/algorithmic-intent-a-hansonian-generalized-anti-zombie)—apparent "stupidity" that achieves a goal through some other channel than their words straightforwardly reflecting the truth. Someone who was _actually_ stupid wouldn't be able to generate text with a specific balance of insight and selective stupidity fine-tuned to reach a gender-politically convenient conclusion without explicitly invoking any controversial gender-political reasoning.
-
-Fortunately, Yudkowsky graciously grants us a clue in the form of [a disclaimer comment](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421833274228):
-
-> It unfortunately occurs to me that I must, in cases like these, disclaim that—to the extent there existed sensible opposing arguments against what I have just said—people might be reluctant to speak them in public, in the present social atmosphere. [...]
->
-> This is a filter affecting your evidence; it has not to my own knowledge filtered out a giant valid counterargument that invalidates this whole post. I would have kept silent in that case, for to speak then would have been dishonest.
->
-> Personally, I'm used to operating without the cognitive support of a civilization in controversial domains, and have some confidence in my own ability to independently invent everything important that would be on the other side of the filter and check it myself before speaking. So you know, from having read this, that I checked all the speakable and unspeakable arguments I had thought of, and concluded that this speakable argument would be good on net to publish, as would not be the case if I knew of a stronger but unspeakable counterargument in favor of Gendered Pronouns For Everyone and Asking To Leave The System Is Lying.
->
-> But the existence of a wide social filter like that should be kept in mind; to whatever quantitative extent you don't trust your ability plus my ability to think of valid counterarguments that might exist, as a Bayesian you should proportionally update in the direction of the unknown arguments you speculate might have been filtered out.
-
-So, the explanation of [the problem of political censorship filtering evidence](https://www.lesswrong.com/posts/DoPo4PDjgSySquHX8/heads-i-win-tails-never-heard-of-her-or-selective-reporting) here is great, but the part where Yudkowsky claims "confidence in [his] own ability to independently invent everything important that would be on the other side of the filter" is just _laughable_. My point that _she_ and _he_ have existing meanings that you can't just ignore by fiat given that the existing meanings are _exactly_ what motivate people to ask for new pronouns in the first place is _really obvious_.
-
-Really, it would be _less_ embarassing for Yudkowsky if he were outright lying about having tried to think of counterarguments. The original post isn't _that_ bad if you assume that Yudkowsky was writing off the cuff, that he clearly just _didn't put any effort whatsoever_ into thinking about why someone might disagree. If he _did_ put in the effort—enough that he felt comfortable bragging about his ability to see the other side of the argument—and _still_ ended up proclaiming his "simplest and best protocol" without even so much as _mentioning_ any of its incredibly obvious costs ... that's just _pathetic_. If Yudkowsky's ability to explore the space of arguments is _that_ bad, why would you trust his opinion about _anything_?
-
-But perhaps it's premature to judge Yudkowsky without appreciating what tight constraints he labors under. The disclaimer comment mentions "speakable and unspeakable arguments"—but what, exactly, is the boundary of the "speakable"? In response to a commenter mentioning the cost of having to remember pronouns as a potential counterargument, Yudkowsky [offers us another clue](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421833274228&reply_comment_id=10159421871809228):
-
-> People might be able to speak that. A clearer example of a forbidden counterargument would be something like e.g. imagine if there was a pair of experimental studies somehow proving that (a) everybody claiming to experience gender dysphoria was lying, and that (b) they then got more favorable treatment from the rest of society. We wouldn't be able to talk about that. No such study exists to the best of my own knowledge, and in this case we might well hear about it from the other side to whom this is the exact opposite of unspeakable; but that would be an example.
-
-(As an aside, the wording of "we might well hear about it from _the other side_" (emphasis mine) is _very_ interesting, suggesting that the so-called "rationalist" community, is, effectively, a partisan institution, despite its claims to be about advancing the generically human art of systematically correct reasoning.)
-I think (a) and (b) _as stated_ are clearly false, so "we" (who?) fortunately aren't losing much by allegedly not being able to speak them. But what about some _similar_ hypotheses, that might be similarly unspeakable for similar reasons?
-
-Instead of (a), consider the claim that (a′) self-reports about gender dysphoria are substantially distorted by [socially-desirable responding tendencies](https://en.wikipedia.org/wiki/Social-desirability_bias)—as a notable and common example, heterosexual males with [sexual fantasies about being female](http://www.annelawrence.com/autogynephilia_&_MtF_typology.html) [often falsely deny or minimize the erotic dimension of their desire to change sex](/papers/blanchard-clemmensen-steiner-social_desirability_response_set_and_systematic_distortion.pdf) (The idea that self-reports can be motivatedly inaccurate without the subject consciously "lying" should not be novel to someone who co-blogged with [Robin Hanson](https://en.wikipedia.org/wiki/The_Elephant_in_the_Brain) for years!)
-
-And instead of (b), consider the claim that (b′) transitioning is socially rewarded within particular _subcultures_ (although not Society as a whole), such that many of the same people wouldn't think of themselves as trans or even gender-dysphoric if they lived in a different subculture.
-
-I claim that (a′) and (b′) are _overwhelmingly likely to be true_. Can "we" talk about _that_? Are (a′) and (b′) "speakable", or not?
-
-We're unlikely to get clarification from Yudkowsky, but based on my experiences with the so-called "rationalist" community over the past coming-up-on-six years—the Whole Dumb Story of which might need to be the topic of _another_ future multi-thousand-word blog post, which I've found difficult to write, because it still hurts—I'm going to _guess_ that the answer is broadly No: no, "we" can't talk about that.
-
-But if I'm right that (a′) and (b′) should be live hypotheses and that Yudkowsky would consider them "unspeakable", that means "we" can't talk about what's _actually going on_ with gender dysphoria and transsexuality, which puts the whole discussion in a different light. In another comment, Yudkowsky lists some gender-transition interventions he named in [a November 2018 Twitter thread](https://twitter.com/ESYudkowsky/status/1067183500216811521) that was the precursor to the present discussion—using a different bathroom, changing one's name, asking for new pronouns, and getting sex reassignment surgery—and notes that none of these are calling oneself a "woman". [He continues](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421986539228&reply_comment_id=10159424960909228):
-
-> [Calling someone a "woman"] _is_ closer to the right sort of thing _ontologically_ to be true or false. More relevant to the current thread, now that we have a truth-bearing sentence, we can admit of the possibility of using our human superpower of language to _debate_ whether this sentence is indeed true or false, and have people express their nuanced opinions by uttering this sentence, or perhaps a more complicated sentence using a bunch of caveats, or maybe using the original sentence uncaveated to express their belief that this is a bad place for caveats. Policies about who uses what bathroom also have consequences and we can debate the goodness or badness (not truth or falsity) of those policies, and utter sentences to declare our nuanced or non-nuanced position before or after that debate.
->
-> Trying to pack all of that into the pronouns you'd have to use in step 1 is the wrong place to pack it.
-
-Sure, _if we were in the position of designing a constructed language from scratch_ under current social conditions in which a person's "gender" is a contested social construct, rather than their sex an objective and undisputed fact, then yeah: in that situation _which we are not in_, you definitely wouldn't want to pack sex or gender into pronouns. But it's a disingenuous derailing tactic to grandstand about how people need to alter the semantics of their _already existing_ native language so that we can discuss the real issues under an allegedly superior pronoun convention when, _by your own admission_, you have _no intention whatsoever of discussing the real issues!_
-
-(Lest the "by your own admission" clause seem too accusatory, I should note that given constant behavior, admitting it is _much_ better than not-admitting it; so, huge thanks to Yudkowsky for the transparency on this point!)
-
-Again, a comparison to the _tú_/_usted_ distinction is instructive. It's one thing to advocate for collapsing the distinction and just settling on one second-person singular pronoun for the Spanish language. That's principled.
-
-It's quite another thing altogether to _simultaneously_ try to prevent a speaker from using _tú_ to indicate disrespect towards a social superior (on the stated rationale that the _tú_/_usted_ distinction is dumb and shouldn't exist), while _also_ refusing to entertain or address the speaker's arguments explaining _why_ they think their interlocutor is unworthy of the deference that would be implied by _usted_ (because such arguments are "unspeakable" for political reasons). That's just psychologically abusive.
-
-If Yudkowsky _actually_ possessed (and felt motivated to use) the "ability to independently invent everything important that would be on the other side of the filter and check it [himself] before speaking", it would be _obvious_ to him that "Gendered Pronouns For Everyone and Asking To Leave The System Is Lying" isn't the hill anyone would care about dying on if it weren't a Schelling point. A lot of TERF-adjacent folk would be _overjoyed_ to concede the (boring, insubstantial) matter of pronouns as a trivial courtesy if it meant getting to _actually_ address their real concerns of "Biological Sex Actually Exists", and ["Biological Sex Cannot Be Changed With Existing or Foreseeable Technology"](https://www.lesswrong.com/posts/QZs4vkC7cbyjL9XA9/changing-emotions) and "Biological Sex Is Sometimes More Relevant Than Self-Declared Gender Identity." The reason so many of them are inclined to stand their ground and not even offer the trivial courtesy is because they suspect that the matter of pronouns is being used as a rhetorical wedge and typographical attack to try to prevent people from talking or thinking about sex.
-
-And this suspicion seems broadly accurate! _After_ having been challenged on it, Yudkowsky can try to spin his November 2018 Twitter comments as having been a non-partisan matter of language design ("Trying to pack all of that into the pronouns [...] is the wrong place to pack it"), but when you read the text that was actually published at the time, parts of it are hard to read as anything other than an attempt to intimidate and delegitimize people who want to use language to reason about sex rather than gender identity.
-
-----
-
-Having analyzed the _ways_ in which Yudkowsky is playing dumb here, what's still not entirely clear is _why_. Presumably he cares about maintaining his credibility as an insightful and fair-minded thinker. Why tarnish that by putting on this haughty performance?
-
-Of course, presumably he _doesn't_ think he's tarnishing it—but why not? [He graciously explains in the Facebook comments](https://www.facebook.com/yudkowsky/posts/10159421750419228?comment_id=10159421833274228&reply_comment_id=10159421901809228):
-
-> it is sometimes personally prudent and not community-harmful to post your agreement with Stalin about things you actually agree with Stalin about, in ways that exhibit generally rationalist principles, especially because people do _know_ they're living in a half-Stalinist environment [...] I think people are better off at the end of that.
-
-Ah, _prudence_! He continues:
-
-> I don't see what the alternative is besides getting shot, or utter silence about everything Stalin has expressed an opinion on including "2 + 2 = 4" because if that logically counterfactually were wrong you would not be able to express an opposing opinion.
-
-The problem with trying to "exhibit generally rationalist principles" in an line of argument that you're constructing in order to be prudent and not community-harmful, is that you're thereby necessarily _not_ exhibiting the central rationalist principle that what matters is the process that _determines_ your conclusion, not the reasoning you present to _reach_ your presented conclusion, after the fact.
-
-The best explanation of this I know was authored by Yudkowsky himself in 2007, in a post titled ["A Rational Argument"](https://www.lesswrong.com/posts/9f5EXt8KNNxTAihtZ/a-rational-argument). It's worth quoting at length. The Yudkowsky of 2007 invites us to consider the plight of a political campaign manager:
-
-> As a campaign manager reading a book on rationality, one question lies foremost on your mind: "How can I construct an impeccable rational argument that Mortimer Q. Snodgrass is the best candidate for Mayor of Hadleyburg?"
->
-> Sorry. It can't be done.
->
-> "What?" you cry. "But what if I use only valid support to construct my structure of reason? What if every fact I cite is true to the best of my knowledge, and relevant evidence under Bayes's Rule?"
->
-> Sorry. It still can't be done. You defeated yourself the instant you specified your argument's conclusion in advance.
-
-The campaign manager is in possession of a survey of mayoral candidates on which Snodgrass compares favorably to other candidates, except for one question. The post continues (bolding mine):
-
-> So you are tempted to publish the questionnaire as part of your own campaign literature ... with the 11th question omitted, of course.
->
-> **Which crosses the line between _rationality_ and _rationalization_.** It is no longer possible for the voters to condition on the facts alone; they must condition on the additional fact of their presentation, and infer the existence of hidden evidence.
->
-> Indeed, **you crossed the line at the point where you considered whether the questionnaire was favorable or unfavorable to your candidate, before deciding whether to publish it.** "What!" you cry. "A campaign should publish facts unfavorable to their candidate?" But put yourself in the shoes of a voter, still trying to select a candidate—why would you censor useful information? You wouldn't, if you were genuinely curious. If you were flowing _forward_ from the evidence to an unknown choice of candidate, rather than flowing _backward_ from a fixed candidate to determine the arguments.
-
-The post then briefly discusses the idea of a "logical" argument, one whose conclusions follow from its premises. "All rectangles are quadrilaterals; all squares are quadrilaterals; therefore, all squares are rectangles" is given as an example of _illogical_ argument, even though the both premises are true (all rectangles and squares are in fact quadrilaterals) _and_ the conclusion is true (all squares are in fact rectangles). The problem is that the conclusion doesn't _follow_ from the premises; the _reason_ all squares are rectangles isn't _because_ they're both quadrilaterals. If we accepted arguments of the general _form_ "all A are C; all B are C; therefore all A are B", we would end up believing nonsense.
-
-Yudkowsky's conception of a "rational" argument—at least, Yudkowsky's conception in 2007, which the Yudkowsky of the current year seems to disagree with—has a similar flavor: the stated reasons should be the actual reasons. The post concludes:
-
-> If you really want to present an honest, rational argument _for your candidate_, in a political campaign, there is only one way to do it:
->
-> * _Before anyone hires you_, gather up all the evidence you can about the different candidates.
-> * Make a checklist which you, yourself, will use to decide which candidate seems best.
-> * Process the checklist.
-> * Go to the winning candidate.
-> * Offer to become their campaign manager.
-> * When they ask for campaign literature, print out your checklist.
->
-> Only in this way can you offer a _rational_ chain of argument, one whose bottom line was written flowing _forward_ from the lines above it. Whatever _actually_ decides your bottom line is the only thing you can _honestly_ write on the lines above.
-
-I remember this being pretty shocking to read back in 'aught-seven. What an alien mindset! But it's _correct_. You can't rationally argue "for" a chosen conclusion, because only the process you use to _decide what to argue for_ can be your real reason.
-
-This is a shockingly high standard for anyone to aspire to live up to—but what made Yudkowsky's Sequences so life-changingly valuable, was that they articulated the _existence_ of such a standard. For that, I will always be grateful.
-
-... which is why it's so _bizarre_ that the Yudkowsky of the current year acts like he's never heard of it! If your _actual_ bottom line is that it is sometimes personally prudent and not community-harmful to post your agreement with Stalin, then sure, you can _totally_ find something you agree with to write on the lines above! Probably something that "exhibits generally rationalist principles", even! It's just that any rationalist who sees the game you're playing is going to correctly identify you as a partisan hack on this topic and take that into account when deciding whether they can trust you on other topics.
-
-"I don't see what the alternative is besides getting shot," Yudkowsky muses (where presumably, 'getting shot' is a metaphor for a large negative utility, like being unpopular with progressives). Yes, an astute observation! And _any other partisan hack could say exactly the same_, for the same reason. Why does the campaign manager withhold the results of the 11th question? Because he doesn't see what the alternative is besides getting shot.
-
-Yudkowsky [sometimes](https://www.lesswrong.com/posts/K2c3dkKErsqFd28Dh/prices-or-bindings) [quotes](https://twitter.com/ESYudkowsky/status/1456002060084600832) _Calvin and Hobbes_: "I don't know which is worse, that everyone has his price, or that the price is always so low."
-
-If the idea of being fired from the Snodgrass campaign or being unpopular with progressives is _so_ terrifying to you that it seems analogous to getting shot, then, if those are really your true values, then sure—say whatever you need to say to keep your job and your popularity, as is personally prudent. You've set your price. But if the price you put on the intellectual integrity of your so-called "rationalist" community is similar to that of the Snodgrass for Mayor campaign, you shouldn't be surprised if intelligent, discerning people accord similar levels of credibility to the two groups' output.
-
-I see the phrase "bad faith" thrown around more than I think people know what it means. "Bad faith" doesn't mean "with ill intent", and it's more specific than "dishonest": it's [adopting the surface appearance of being moved by one set of motivations, while actually acting from another](https://en.wikipedia.org/wiki/Bad_faith).
-
-For example, an [insurance company employee](https://en.wikipedia.org/wiki/Claims_adjuster) who goes through the motions of investigating your claim while privately intending to deny it might never consciously tell an explicit "lie", but is definitely acting in bad faith: they're asking you questions, demanding evidence, _&c._ in order to _make it look like_ you'll get paid if you prove the loss occurred—whereas in reality, you're just not going to be paid. Your responses to the claim inspector aren't completely casually _inert_: if you can make an extremely strong case that the loss occurred as you say, then the claim inspector might need to put some effort into coming up with some ingenious excuse to deny your claim in ways that exhibit general claim-inspection principles. But at the end of the day, the inspector is going to say what they need to say in order to protect the company's loss ratio, as is personally prudent.
-
-With this understanding of bad faith, we can read Yudkowsky's "it is sometimes personally prudent [...]" comment as admitting that his behavior on politically-charged topics is in bad faith—where "bad faith" isn't a meaningless insult, but [literally refers](http://benjaminrosshoffman.com/can-crimes-be-discussed-literally/) to the pretending-to-have-one-set-of-motivations-while-acting-according-to-another behavior, such that accusations of bad faith can be true or false. Yudkowsky will never consciously tell an explicit "lie", but he'll go through the motions to _make it look like_ he's genuinely engaging with questions where I need the right answers in order to make extremely impactful social and medical decisions—whereas in reality, he's only going to address a selected subset of the relevant evidence and arguments that won't get him in trouble with progressives.
-
-To his credit, he _will_ admit that he's only willing to address a selected subset of arguments—but while doing so, he claims an absurd "confidence in [his] own ability to independently invent everything important that would be on the other side of the filter and check it [himself] before speaking" while _simultaneously_ blatantly mischaracterizing his opponents' beliefs! ("Gendered Pronouns For Everyone and Asking To Leave The System Is Lying" doesn't pass anyone's [ideological Turing test](https://www.econlib.org/archives/2011/06/the_ideological.html).)
-
-Counterarguments aren't completely causally _inert_: if you can make an extremely strong case that Biological Sex Is Sometimes More Relevant Than Self-Declared Gender Identity, Yudkowsky will put some effort into coming up with some ingenious excuse for why he _technically_ never said otherwise, in ways that exhibit generally rationalist principles. But at the end of the day, Yudkowsky is going to say what he needs to say in order to protect his reputation, as is personally prudent.
-
-Even if one were to agree with this description of Yudkowsky's behavior, it doesn't immediately follow that Yudkowsky is making the wrong decision. Again, "bad faith" is meant as a literal description that makes predictions about behavior, not a contentless attack—maybe there are some circumstances in which engaging some amount of bad faith is the right thing to do, given the constraints one faces! For example, when talking to people on Twitter with a very different ideological background from me, I sometimes anticipate that if my interlocutor knew what I was actually thinking, they wouldn't want to talk to me, so I take care to word my replies in a way that makes it look like I'm more ideologically aligned with them than I actually am. (For example, I [never say "assigned female/male at birth" in my own voice on my own platform](/2019/Sep/terminology-proposal-developmental-sex/), but I'll do it in an effort to speak my interlocutor's language.) I think of this as the _minimal_ amount of strategic bad faith needed to keep the conversation going, to get my interlocutor to evaluate my argument on its own merits, rather than rejecting it for coming from an ideological enemy. In cases such as these, I'm willing to defend my behavior as acceptable—there _is_ a sense in which I'm being deceptive by optimizing my language choice to make my interlocutor make bad guesses about my ideological alignment, but I'm comfortable with that amount and scope of deception because I don't think my interlocutor _should_ be paying attention to my personal alignment.
-
-[TODO: the term is "concern trolling"; speak of trying to correct a distortion]
-
-That is, my bad faith Twitter gambit of deceiving people about my ideological alignment in the hopes of improving the discussion seems like something that makes our collective beliefs about the topic-being-argued-about _more_ accurate. (And the topic-being-argued-about is presumably of greater collective interest than which "side" I personally happen to be on.)
-
-In contrast, the "it is sometimes personally prudent [...] to post your agreement with Stalin" gambit is the exact reverse: it's _introducing_ a distortion into the discussion in the hopes of correcting people's beliefs about the speaker's ideological alignment. (Yudkowsky is not a right-wing Bad Guy, but people would tar him as a right-wing Bad Guy if he ever said anything negative about trans people.) This doesn't improve our collective beliefs about the topic-being-argued about; it's a _pure_ ass-covering move.
-
-Yudkowsky names the alleged fact that "people do _know_ they're living in a half-Stalinist environment" as a mitigating factor. But the _reason_ censorship is such an effective tool in the hands of dictators like Stalin is because it ensures that many people _don't_ know—and that those who know (or suspect) don't have [game-theoretic common knowledge](https://www.lesswrong.com/posts/9QxnfMYccz9QRgZ5z/the-costly-coordination-mechanism-of-common-knowledge#Dictators_and_freedom_of_speech) that others do too.
-
-Zvi Mowshowitz has [written about how the false assertion that "everybody knows" something](https://thezvi.wordpress.com/2019/07/02/everybody-knows/) is typically used justify deception: if "everybody knows" that we can't talk about biological sex (the reasoning goes), then no one is being deceived when our allegedly truthseeking discussion carefully steers clear of any reference to the reality of biological sex when it would otherwise be extremely relevant.
-
-But if it were _actually_ the case that everybody knew (and everybody knew that everybody knew), then what would be the point of the censorship? It's not coherent to claim that no one is being harmed by censorship because everyone knows about it, because the entire appeal and purpose of censorship is precisely that _not_ everybody knows and that someone with power wants to _keep_ it that way.
-
-For the savvy people in the know, it would certainly be _convenient_ if everyone secretly knew: then the savvy people wouldn't have to face the tough choice between acceding to Power's demands (at the cost of deceiving their readers) and informing their readers (at the cost of incurring Power's wrath).
-
-Policy debates should not appear one-sided. Faced with this kind of dilemma, I can't say that defying Power is necessarily the right choice: if there really _were_ no other options between deceiving your readers with a bad faith performance, and incurring Power's wrath, and Power's wrath would be too terrible to bear, then maybe deceiving your readers with a bad faith performance is the right thing to do.
-
-But if you actually _cared_ about not deceiving your readers, you would want to be _really sure_ that those _really were_ the only two options. You'd [spend five minutes by the clock looking for third alternatives](https://www.lesswrong.com/posts/erGipespbbzdG5zYb/the-third-alternative)—including, possibly, not issuing proclamations on your honor as leader of the so-called "rationalist" community on topics where you _explicitly intend to ignore counteraguments on grounds of their being politically unfavorable_. Yudkowsky rejects this alternative on the grounds that it allegedly implies "utter silence about everything Stalin has expressed an opinion on including '2 + 2 = 4' because if that logically counterfactually were wrong you would not be able to express an opposing opinion", but this seems like yet another instance of Yudkowsky motivatedly playing dumb: if he _wanted_ to, I'm sure Eliezer Yudkowsky could think of _some relevant differences_ between "2 + 2 = 4" (a trivial fact of arithmetic) and "the simplest and best protocol is, "'He' refers to the set of people who have asked us to use 'he'" (a complex policy proposal whose numerous flaws I have analyzed in detail above).
-
-"I think people are better off at the end of that," Yudkowsky writes of the consequences of posting-your-agreement-with-Stalin policies. But here I think we need a more conflict-theoretic analysis that looks at a more detailed level than "people." _Who_ is better off, specifically? 
-
-... and, I had been planning to save the Whole Dumb Story about my alienation from Yudkowsky's so-called "rationalists" for a _different_ multi-thousand-word blog post, because _this_ multi-thousand-word blog post was supposed to be narrowly scoped to _just_ exhaustively replying to Yudkowsky's February 2021 Facebook post about pronoun conventions. But in order to explain the problems with "people do _know_ they're living in a half-Stalinist environment" and "people are better off at the end of that", I may need to _briefly_ recap some of the history leading to the present discussion, which explains why _I_ didn't know and _I'm_ not better off, with the understanding that it's only a summary and I might still need to tell the long version in a separate post, if it feels still necessary relative to everything else I need to get around to writing. (It's not actually a very interesting story; I just need to get it out of my system so I can stop grieving and move on with my life.)
-
-I _never_ expected to end up arguing about something so _trivial_ as the minutiae of pronoun conventions (which no one would care about if historical contingencies of the evolution of the English language hadn't made them a Schelling point and typographical attack surface for things people do care about). The conversation only ended up here after a series of derailings. At the start, I was _trying_ to say something substantive about the psychology of straight men who wish they were women.
-
-You see, back in the 'aughts when Yudkowsky was writing his Sequences, he occasionally said some things about sex differences that I often found offensive at the time, but which ended up being hugely influential on me, especially in the context of my ideological denial of psychological sex differences and my secret lifelong-since-puberty erotic fantasy about being magically transformed into a woman. I wrote about this at length in a previous post, ["Sexual Dimorphism in Yudkowsky's Sequences, in Relation to my Gender Problems"](/2021/May/sexual-dimorphism-in-the-sequences-in-relation-to-my-gender-problems/)].
-
-In particular, in ["Changing Emotions"](https://www.lesswrong.com/posts/QZs4vkC7cbyjL9XA9/changing-emotions) (and its precursor in a [2004 Extropians mailing list post](https://archive.is/En6qW)), Yudkowsky explains that "changing sex" is vastly easier said than done—
-
-[[[ TODO summarize the Whole Dumb Story (does there need to be a separate post? I'm still not sure)
-
-[TODO: But that was all about me—I assumed "trans" was a different thing. My first clue that I might not be living in that world came from—Eliezer Yudkowsky, with the "at least 20% of the ones with penises are actually women" thing]
-
-_After it's been pointed out_, it should be a pretty obvious hypothesis that "guy on the Extropians mailing list in 2004 who fantasizes about having a female counterpart" and "guy in 2016 Berkeley who identifies as a trans woman" are the _same guy_. 
-
-[So I ended up arguing with people about the two-type taxonomy, and I noticed that those discussions kept getting _derailed_ on some variation of "The word woman doesn't actually mean that". So I took the bait, and starting arguing against that, and then Yudkowsky comes back to the subject with his "Hill of Validity in Defense of Meaning"—and I go on a philosophy of language crusade, and Yudkowsky eventually clarifies, and _then_ he comes back _again_ in Feb. 2022 with his "simplest and best protocol"]
-
-]]]
-
-At this point, the nature of the game is very clear. Yudkowsky wants to make sure he's on peaceful terms with the progressive _Zeitgeist_, subject to the constraint of not saying anything he knows to be false. Meanwhile, I want to actually make sense of what's actually going on in the world as regards sex and gender, because _I need the correct answer to decide whether or not to cut my dick off_.
-
-On "his turn", he comes up with some pompous proclamation that's very obviously optimized to make the "pro-trans" faction look smart and good and make the "anti-trans" faction look dumb and bad, "in ways that exhibit generally rationalist principles."
-
-On "my turn", I put in an _absurd_ amount of effort explaining in exhaustive, _exhaustive_ detail why Yudkowsky's pompous proclamation, while [not technically saying making any unambiguously "false" atomic statements](https://www.lesswrong.com/posts/MN4NRkMw7ggt9587K/firming-up-not-lying-around-its-edge-cases-is-less-broadly), was _substantively misleading_ as constrated to what any serious person would say if they were actually trying to make sense of the world without worrying what progressive activists would think of them.
-
-Note: being _on peaceful terms_ with the progressive _Zeitgeist_ isn't the same as kowtowing to it entirely. So, for example, Yudkowsky is _also_ on the record claiming that—
-
-> [Everything more complicated than](https://twitter.com/ESYudkowsky/status/1108277090577600512) protons tends to come in varieties. Hydrogen, for example, has isotopes. Gender dysphoria involves more than one proton and will probably have varieties.
-
-> [To be clear, I don't](https://twitter.com/ESYudkowsky/status/1108280619014905857) know much about gender dysphoria. There's an allegation that people are reluctant to speciate more than one kind of gender dysphoria. To the extent that's not a strawman, I would say only in a generic way that GD seems liable to have more than one species.
-
-There's a sense in which this could be read as a "concession" to my agenda. The two-type taxonomy of MtF _was_ the thing I was originally trying to talk about, before the philosophy-of-language derailing, and here Yudkowsky is backing up "my side" on that by publicly offering an argument that there's probably a more-than-one-type typology. So there's an intuition that I should be grateful for and satisfied with this concession—that it would be _greedy_ for me to keep criticizing him about the pronouns and language thing, given that he's throwing me a bone here.
-
-But that intuition is _wrong_. The perception that there are "sides" to which one can make "concessions" is an _illusion_ of the human cognitive architecture; it's not something that any sane cognitive process would think in the course of constructing a map that reflects the territory.
-
-As I explained in ["On the Argumentative Form 'Super-Proton Things Tend to Come In Varieties'"](/2019/Dec/on-the-argumentative-form-super-proton-things-tend-to-come-in-varieties/), this argument that "gender dysphoria involves more than one proton and will probably have varieties" is actually _wrong_. The _reason_ I believe in the two-type taxonomy of MtF is because of [the _empirical_ case that androphilic and non-exclusively-androphilic MtF transsexualism actually look like different things](https://sillyolme.wordpress.com/faq-on-the-science/), enough so for the two-type clustering to [pay the rent](https://www.lesswrong.com/posts/a7n8GdKiAZRX86T5A/making-beliefs-pay-rent-in-anticipated-experiences) [for its complexity](https://www.lesswrong.com/posts/mB95aqTSJLNR9YyjH/message-length).
-
-But Yudkowsky can't afford to acknowledge the empirical case for the two-type taxonomy—that really _would_ get him in trouble with progressives. So in order to throw me a bone while maintaining his above-it-all [pretending to be wise](https://www.lesswrong.com/posts/jeyvzALDbjdjjv5RW/pretending-to-be-wise) centerist pose, he needs to come up with some other excuse that "exhibit[s] generally rationalist principles".
-
-The lesson here that I wish Yudkowsky would understand is that when you invent rationality lessons in response to political pressure, you probably end up with _fake rationality lessons_ (because the reasoning that _generated_ the lesson differs from the reasoning that the lesson presents). I think this is bad, and that it's _equally_ bad even when the political pressure is coming from _me_.
-
-If you "project" my work into the "subspace" of contemporary political conflicts, it usually _codes as_ favoring "anti-trans" faction more often than not, but [that's really not what I'm trying to do](/2021/Sep/i-dont-do-policy/). From my perspective, it's just that the "pro-trans" faction happens to be very wrong about a lot of stuff that I care about. But being wrong about a lot of stuff isn't the same thing as being wrong about everything; it's _important_ that I spontaneously invent and publish pieces like ["On the Argumentative Form"](/2019/Dec/on-the-argumentative-form-super-proton-things-tend-to-come-in-varieties/) and ["Self-Identity Is a Schelling Point"](/2019/Oct/self-identity-is-a-schelling-point/) that "favor" the "pro-trans" faction. That's how you know (and how I know) that I'm not a _partisan hack_.
-
-In the context of AI alignment theory, Yudkowsky has written about a "nearest unblocked strategy" phenomenon: if you directly prevent an agent from accomplishing a goal via some plan that you find undesirable, the agent will search for ways to route around that restriction, and probably find some plan that you find similarly undesirable for similar reasons.
-
-Suppose you developed an AI to [maximize human happiness subject to the constraint of obeying explicit orders](https://arbital.greaterwrong.com/p/nearest_unblocked#exampleproducinghappiness). It might first try administering heroin to humans. When you order it not to, it might switch to administering cocaine. When you order it to not use any of a whole list of banned happiness-producing drugs, it might switch to researching new drugs, or just _pay_ humans to take heroin, _&c._
-
-It's the same thing with Yudkowsky's political-risk minimization subject to the constraint of not saying anything he knows to be false. First he comes out with ["I think I'm over 50% probability at this point that at least 20% of the ones with penises are actually women"](https://www.facebook.com/yudkowsky/posts/10154078468809228) (March 2016). When you point out that [that's not true](https://www.lesswrong.com/posts/QZs4vkC7cbyjL9XA9/changing-emotions), then the next time he revisits the subject, he switches to ["you're not standing in defense of truth if you insist on a word, brought explicitly into question, being used with some particular meaning"](https://archive.is/Iy8Lq) (November 2018). When you point out that [_that's_ not true either](https://www.lesswrong.com/posts/FaJaCgqBKphrDzDSj/37-ways-that-words-can-be-wrong), he switches to "It is Shenanigans to try to bake your stance on how clustered things are [...] _into the pronoun system of a language and interpretation convention that you insist everybody use_" (February 2021). When you point out that's not what's going on, he switches to ... I don't know, but he's a smart guy; in the unlikely event that he sees fit to respond to this post, I'm sure he'll be able to think of _something_—but at this point, I have no reason to care. Talking to Yudkowsky on topics where getting the right answer would involve acknowledging facts that would make you unpopular in Berkeley is a _waste of everyone's time_; trying to inform you isn't [his bottom line](https://www.lesswrong.com/posts/34XxbRFe54FycoCDw/the-bottom-line).
-
-Accusing one's interlocutor of bad faith is frowned upon for a reason. We would prefer to live in a world where we have intellectually fruitful object-level discussions under the assumption of good faith, rather than risk our fora degenerating into an acrimonious brawl of accusations and name-calling, which is unpleasant and (more importantly) doesn't make any intellectual progress. I, too, would prefer to have a real object-level discussion under the assumption of good faith.
-
-I tried the object-level good-faith argument thing _first_. I tried it for _years_. But at some point, I think I should be _allowed to notice_ the nearest-unblocked-strategy game which is _very obviously happening_ if you look at the history of what was said. I think there's _some_ number of years and _some_ number of thousands of words of litigating the object-level after which there's nothing left for me to do but jump up a meta level and explain, to anyone capable of hearing it, why in this case I think I've accumulated enough evidence in this case for the assumption of good faith to have been _empirically falsified_.
-
-(Of course, I realize that if we're crossing the Rubicon of abandoning the norm of assuming good faith, it needs to be abandoned symmetrically. I _think_ I'm doing a _pretty good_ job of adhering to standards of intellectual conduct and being transparent about my motivations, but I'm definitely not perfect, and, unlike Yudkowsky, I'm not so absurdly miscalibratedly arrogant to claim "confidence in my own ability to independently invent everything important" (!) about my topics of interest. If Yudkowsky or anyone else thinks they _have a case_ based on my behavior that _I'm_ being culpably intellectually dishonest, they of course have my blessing and encouragement to post it for the audience to evaluate.)
-
-What makes all of this especially galling is the fact that _all of my heretical opinions are literally just Yudkowsky's opinions from the 'aughts!_ My whole thing about how changing sex isn't possible with existing technology because the category encompasses so many high-dimensional details? Not original to me! I [filled in a few trivial technical details](/2021/May/sexual-dimorphism-in-the-sequences-in-relation-to-my-gender-problems/#changing-sex-is-hard), but again, this was _in the Sequences_ as ["Changing Emotions"](https://www.lesswrong.com/posts/QZs4vkC7cbyjL9XA9/changing-emotions). My thing about how you can't define concepts any way you want, because there are mathematical laws governing which category boundaries compress your anticipated experiences? Not original to me! I [filled in](https://www.lesswrong.com/posts/esRZaPXSHgWzyB2NL/where-to-draw-the-boundaries) [a few technical details](https://www.lesswrong.com/posts/onwgTH6n8wxRSo2BJ/unnatural-categories-are-optimized-for-deception), but [_we had a whole Sequence about this._](https://www.lesswrong.com/posts/FaJaCgqBKphrDzDSj/37-ways-that-words-can-be-wrong)
-
-Seriously, you think I'm _smart enough_ to come up with all of this indepedently? I'm not! I ripped it all off from Yudkowsky back in the 'aughts _when he still gave a shit about telling the truth_ in this domain. (More precisely, when he thought he could afford to give a shit, before the political environment and the growing stature of his so-called "rationalist" movement changed his incentives.)
-
-Does ... does he expect us not to _notice_? Or does he think that "everybody knows"?
-
-But I don't think that everybody knows. So I'm telling you.
-
-Why does this matter?
-
-[Why does this matter? It would be dishonest for me to claim that this is _directly_ relevant to xrisk, because that's not my real bottom line]
-
-a rationality community that can't think about _practical_ issues that affect our day to day lives, but can get existential risk stuff right, is like asking for self-driving car software that can drive red cars but not blue cars
-
-It's a _problem_ if public intellectuals in the current year need to pretend to be dumber than seven-year-olds in 2016
-
-> _Perhaps_, replied the cold logic. _If the world were at stake._
->
-> _Perhaps_, echoed the other part of himself, _but that is not what was actually happening._
-https://www.yudkowsky.net/other/fiction/the-sword-of-good
-
-https://www.readthesequences.com/
-> Because it is all, in the end, one thing. I talked about big important distant problems and neglected immediate life, but the laws governing them aren't actually different.
-
-> the challenge is almost entirely about high integrity communication by small groups
-https://twitter.com/HiFromMichaelV/status/1486044326618710018